7月7日,在2023世界人工智能大会(WAIC)上,商汤科技作为大会战略合作伙伴举办了“大爱无疆·日日新”人工智能论坛,现场重磅推出 “商汤日日新SenseNova”大模型体系的多方位全面升级,以及在该体系下的一系列大模型产品更新和落地成果。
此外,商汤也着重介绍并展示了其大模型技术自正式发布以来与产业各方的应用实践,包括商汤绝影最新打造的智能座舱产品和车路云协同交通体系等,以及在金融、医疗、电商、移动终端、产业园区等行业生产实践中的落地应用。
“日日新SenseNova”实现全方位升级
在产品发布环节,商汤科技董事长兼CEO徐立表示:“大模型的突破掀起了人工智能的新一轮技术革命,随之而来的是产业需求呈现爆炸式增长,全新的应用场景和应用模式正迅速涌现。商汤希望通过‘大模型+大装置’持续推动AI基础设施能力的跃进提升,不仅打造通用能力更加强大的基础模型,也进一步高效融合不同垂直领域的专业知识,构建更懂行业、更具专长的专业大模型,从根本上降低大模型的下游应用成本和门槛,让大模型的产业价值在千行百业中绽放。”
寓意“模型迭代速度和处理问题的能力可以日日更新”,商汤大模型体系在其“大模型+大装置”的AGI战略布局下,正进行着高速迭代。作为千亿级参数的自然语言处理模型,商汤商量SenseChat 2.0版本突破了大语言模型输入长度的限制,并推出不同参数量级的模型版本,可完美适配移动端、云端等不同终端及场景的应用需求,降低部署成本。商汤的自研生成式大模型商汤秒画SenseMirage 3.0的模型参数,也从今年4月首次发布以来的10亿提升至70亿量级,能够实现专业摄影级的图片细节刻画。
此外,商汤如影SenseAvatar 2.0数字人生成平台相较1.0版本的语音和口型流畅度提升30%以上,实现4K高清视频效果,并带来AIGC生成形象及数字人歌唱功能。商汤琼宇SenseSpace 2.0的空间重建效率提升20%,渲染性能提升50%,每100平方公里场景的建图时间仅需38小时即可完成(1200 TFLOPS/秒算力支持);而商汤格物SenseThings 2.0对小物体的纹理及材质还原达到毫米级精细度,并突破对高反光和镜面物体的采集难题。
多模态赋能不同产业
依托 “商汤日日新SenseNova”大模型体系在底层技术领域的快速迭代,商汤还正在积极通过大模型的多模态能力组合赋能产业升级。
据介绍,在金融领域,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效。挂载金融知识库后,还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。
在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型“大医”,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,未来还将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,持续赋能医院诊疗效率及患者服务提升。
结合商量2.0和秒画3.0的综合能力,商汤为移动终端客户带来多种智能交互解决方案,包括针对信息获取的问答交互,针对生活场景的知识交互,针对语言和图像生成的内容交互等。
面向线下场景和线上短视频、直播平台等,商汤也都给予了不同赋能。其中商汤如影2.0生成的数字人正得到广泛应用。
在智能汽车领域,商汤绝影智能座舱、智能驾驶、车路协同等行业应用也已在大模型的加持下突破创新边界。据悉,在近期的CVPR 2023中,商汤及联合实验室还提出感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构,并获得最佳论文奖,为自动驾驶技术与产业的发展提出了新的方向。
来源:浦东发布