文章主题:商汤大模型产品商量SenseChat,商汤AI大模型,世界人工智能大会,自然语言处理模型

666AI工具大全,助力做AI时代先行者!

打开凤凰新闻,查看更多高清图片

今年6月拍摄的商汤大模型产品商量SenseChat界面

仅仅三个月的时间,商汤科技旗下的“日日新”AI大模型就正式进行了升级,其部分功能已经超过了基于GPT-3.5的ChatGPT。与此同时,这家AI巨头已经开始将精力转向大规模应用大模型的方向。

根据钛媒体App的报道,2023年世界人工智能大会(WAIC)上,商汤科技董事长兼CEO徐立先生正式宣布,其公司的大模型体系“商汤日日新SenseNova”已经完成了多方面的全面升级。同时,他还展示了该体系下方一系列大模型产品的更新版本,以及这些产品在实际应用场景中的落地成果和实践经验。

在此次更新中,商汤科技展示了其在自然语言处理领域的最新成果。首先,商汤推出了全新的“商量”2.0版本,这款模型拥有千亿级参数,能够支持阿拉伯语和粤语等多种语言,同时推出了小型的商量S版(SenseChat S)。这些不同参数量级的模型版本可以适应各种应用场景和终端设备的需求。此外,商汤还推出了全新一代秒画3.0,该版本的参数量提升到了70亿级别,较之前的版本有了显著的提升。而对于视频监控领域,商汤的如影2.0版本也进行了重大升级,其语音和口型流畅度提升了30%以上,使得用户能够更准确地理解和分析视频内容。商汤的琼宇2.0版本在空间重建效率上提升了20%,渲染性能也提升了50%,这使得该版本在处理大规模场景时更加高效。而在对物品纹理及材质渲染方面,格物2.0版本的精细度更是达到了毫米级,为用户提供了更为真实、细腻的视觉体验。总的来说,商汤科技在自然语言处理、视频监控等多个领域都取得了重要突破,展现了其技术实力和创新能力。

根据相关报道,我们发现商汤科技在今年的3月份发布的2022财报告中,其公司愿景与战略目标已经发生了显著变化。原先,该公司致力于利用人工智能技术实现物理世界和数字世界的融合,以推动社会生产力的可持续发展,并给人们带来更加美好的虚实融合生活体验。然而,如今,商汤科技已经将重心转向了通用人工智能(AGI)技术,将其视为公司的核心战略目标。并且,该公司期望在未来几年内取得AGI技术的重大突破。

在这场变革中,商汤科技立足于全局,提出了“AI for All”的发展战略。为实现这一目标,该公司将集中精力打造两大核心平台:其一是SenseCore Al大装置,作为大模型生产的基石;二是商汤AIDC人工智能计算中心平台,作为大算力AI基础设施的能力保障。通过这两个平台的共同作用,商汤科技致力于构建多模态大模型,同时也在垂直领域内培养具有专业优势的大模型。这样的策略不仅可以降低大模型的下游应用成本和门槛,更可以保证AI技术的发展造福于全人类。

商汤2022财年财报会议公布新的发展目标

今年4月10日,商汤科技正式对外披露了其全新的“日日新SenseNova”大模型体系,以及由自身研发的中文语言大模型应用平台——“商量”。这两个平台的参数量均达到了千亿级别,具备文本生成、图像生成以及多模态内容生成等强大的能力,并能广泛应用于各种场景中。此外,商汤科技还与上海AI实验室共同研发出了适用于多模态和多任务的通用大模型——“书生”。(参见钛媒体App:《商汤版ChatGPT来袭,中国激战千亿“大模型”》)

本届WAIC上,商汤更迭日日新SenseNova大模型体系以及一系列大模型、数字人、文生图产品应用,在整个性能、数据准确度和精度等方面均有提升。

“日日新”大模型体系下,自然语言处理模型“商量”2.0版本突破了大语言模型输入长度的限制,推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求,降低部署成本。

文生图生成式AI模型“秒画”3.0的模型参数从今年4月首次发布以来的10亿提升至70亿量级,实现专业摄影级的图片细节刻画。

数字人生成平台“如影”2.0相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,具备AIGC生成形象及数字人歌唱功能,可应用于线上短视频、直播平台。商汤将与多个头部企业共建“云+AIGC+短视频直播”生态,带来高效低成本的AI视频和营销工具。

3D内容生成平台“琼宇”2.0(场景生成)的空间重建效率提升20%,渲染性能提升50%,1200TFLOPS/秒算力支持下,每100平方公里场景的建图时间仅38小时即可完成。

对于商汤大模型商量2.0,徐立透露,其AI代码助手性能全面提升,推理效率提升619%,HumanEval测试集一次通过率达48.7%,超过GPT-3.5的48.1%。而且,无需训练模型,就可以快速融合知识生成,搭配企业知识库可以快速解决相关领域问题。此外,“针对前端、终端的应用需求,我们推出了小模型,小模型不但性能上有一定突破,在前端的运行上也能够跑到高通骁龙8 Gen2的终端芯片上,使得我们更多的终端应用变得可能。”徐立表示。

算力方面,目前商汤在上海临港AIDC已经有接近3万块的GPU(图形处理器),目前算力已达到5000 PetaFLOPS(1 PetaFLOPS等于每秒1千万亿次浮点运算),能够支持更多千亿规模的大模型算力训练。同时,商汤现已支撑10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。

另外,商汤还现场展示基于日日新SenseNova大模型体系的产业升级和应用落地。

在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效;

在医疗场景,商汤基于医学知识和临床数据开发了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来将支持医学图像、文本、结构化数据等多模态综合分析。

面向线下场景,商汤通过大模型能力为电网巡检带来长尾故障识别、复杂缺陷判断等智能解决方案;

基于琼宇2.0的空间重建,商汤为济南马山镇区域开发、合肥中国视界园区、上海瑞金医院等打造实景空间的数字孪生,提升运营管理效率;

在珠宝行业,依托格物2.0商汤为珠宝品牌进行珠宝首饰复刻,细致展现商品工艺特点,提升顾客购物体验。

此外,在智能汽车的智能座舱方面,商汤致力于建立“车舱大脑”。基于感知决策一体化的自动驾驶通用大模型UniAD,商汤构建车路云协同的交通体系,凭借多模态多任务通用大模型开发路侧视觉感知大模型,结合“琼宇”2.0及“格物”2.0构建智能交通孪生与仿真,并利用“商量”2.0的感知推理和人机交互能力,推动车路云共同向大模型对话式交互演进​。

据徐立透露,商汤自动驾驶通用大模型UniAD在多目标追踪准确率上实现了20%以上的提升,车道线准确率超过30%,运动预测误差降低40%,规划误差降低了30%。据商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚透露,目前该模型正在面向量产,UniAD框架测试下整个智能驾驶有比较显著的提升。

钛媒体App了解到,截至今年5月,基于商汤大装置SenseCore和日日新大模型体系,商汤已获得超过10个大模型客户,超过40个KA(核心关键)客户,超过5个前沿领域覆盖,超过20个行业场景落地。

财报显示,2022财年,商汤科技营收为38.09亿元人民币,其中数字人、AIGC等智慧生活业务板块营收9.55亿元,同比增长129.9%,加上智能汽车业务收入占比为总营收的33%。

商汤CFO王征在年报会议上提到,预计到2025年,商汤两个“火箭”业务文首发钛媒体App,作者|林志佳)

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注