文章主题:人工智能, 大模型, 多模态, 行业应用
在2023世界人工智能大会“大爱无疆·日日新”人工智能论坛的现场,记者了解到,商汤科技所提出的“商汤日日新SenseNova”大模型体系已经成功完成了多方面的升级,并且已经开始在金融、医疗、汽车等多个领域进行实际的应用落地。商汤科技的董事长兼CEO徐立在活动现场明确表示,该公司将致力于通过“大模型 大装置”的方式,不断推动AI基础设施能力的优化提升,以此为基础,构建出更加符合各行业需求、具有更高专业性的的大模型,从而让这些大模型在各个产业中发挥出更大的价值。
在我国“大模型 大装置”的AGI(通用人工智能)战略框架下,商汤大模型体系正以前所未有的速度进行高速迭代。其中,“商量SenseChat”2.0版作为一款拥有千亿级参数的自然语言处理模型,成功突破了大语言模型输入长度的限制,并推出了不同参数量级的模型版本,以满足移动端、云端等不同终端及场景的应用需求。自从今年4月份首次发布以来,生成式大模型“秒画SenseMirage”3.0版的模型参数已经实现了显著的提升,从10亿增长到了70亿量级,从而能够完成专业摄影级别的图片细节刻画。
“如影SenseAvatar”的2.0版数字人生成平台在语音和口型流畅度上较1.0版提升了30%以上,成功实现了4K高清视频的效果,同时还增加了生成形象和数字人歌唱的功能。而”琼宇SenseSpace”的2.0版则将空间重建效率提高了20%,渲染性能也提升了50%,使得每100平方公里的场景建图时间缩短至38小时。”格物SenseThings”的2.0版在纹理和材质的还原上达到了毫米级的精细度,并成功突破了高反光和镜面物体采集的难题。
徐立介绍,依托大模型体系在底层技术上的快速迭代,商汤正在利用大模型的多模态能力赋能多个产业领域。
在金融领域,商汤科技积极与银行、保险、券商等金融机构展开深度合作,以数字人为基础,推动智能客服、智慧营销等多元化应用场景的落地。通过整合大语言模型的强大能力,我们不仅能够提供精准的投研分析以及高质量的研究报告,还能够协助团队降低成本、提高效率。此外,借助金融知识库的赋能,数字人可以实现100%基于客户产品说明的智能问答,确保信息的准确性和时效性,从而更好地满足客户的个性化需求。
作为一款基于海量医学知识和临床数据的医疗场景解决方案,商汤科技成功打造出了一个名为“大医”的中文医疗语言大型模型。该模型在导诊、问诊、健康咨询以及辅助决策等多个医疗场景下,都展现出了强大的多轮对话能力。未来,它甚至将能够支持医学图像、文本以及结构化数据等多模态的综合分析,以此提升医疗语言的理解和推理能力,从而更好地服务于医疗领域。
结合“商量”2.0版与“秒画”3.0版的强大综合能力,我国企业不仅為移動終端客戶提供了多種智能交互解決方案,而且在以刘慈欣著名小說《三體》為故事藍本的《三体·引力之外》沉浸式科幻體驗空間中,商湯通過大模型的幫助,突破了想象力的界限,創造出了一部充滿未來感的科幻 在这种背景下,商湯利用自身在大模型方面的优势,不断创新和突破,为用户带来了更为丰富的交互体验和更为深刻的科技感受。
在智能汽车领域,商汤“绝影”智能座舱、智能驾驶、车路协同等行业应用也在大模型的加持下,突破创新边界。在智能座舱里,通过视觉、听觉等多模态融合,全方位感知用户需求,并通过标签化数据记录用户习惯和偏好,提供专属个性服务。
在车舱外,依托“大模型+大装置”,“绝影”部署端云协同,统一流量入口,支持私有化部署及千万量级的应用需求。在近日举行的2023年CVPR(国际计算机视觉与模式识别会议)上,商汤与合作单位提出了感知决策一体化的自动驾驶通用大模型UniAD,开创了以全局任务为目标的自动驾驶大模型架构,相关论文摘得CVPR最佳论文奖,为自动驾驶技术与产业发展提出了新的方向。
基于此,公司正在打造车路云协同的交通体系,借助多模态、多任务通用大模型开发路侧视觉感知大模型,并结合“琼宇”2.0版和“格物”2.0版,构建智能交通孪生与仿真,推动车路云共同向大模型的对话式交互模式演进。
栏目主编:黄海华
来源:作者:俞陶然
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!