文章主题:人工智能, 大模型, 多模态, 金融
在2023世界人工智能大会“大爱无疆·日日新”人工智能论坛的现场,记者了解到,商汤科技所提出的“商汤日日新SenseNova”大模型体系已经成功完成多方面的升级,并且已经开始在金融、医疗、汽车等多个领域进行实际的应用落地。商汤科技的董事长兼CEO徐立在活动现场明确表示,该公司将致力于通过“大模型 大装置”的方式,不断推动AI基础设施能力的优化提升,以此为基础,构建出更加符合各行业需求、具有更高专业性的的大模型,从而让这些大模型在各个产业中发挥出更大的价值。
在我国“大模型 大装置”的AGI(通用人工智能)战略框架下,商汤大模型体系正在迅速更新换代。其中,“商量SenseChat”2.0版是一款具有千亿级参数的自然语言处理模型,它成功突破了大语言模型输入长度的瓶颈,并推出了各种参数量级的模型版本,以满足移动端、云端等各种终端以及不同应用场景的需求。自从今年4月份首次亮相以来,生成式大模型“秒画SenseMirage”3.0版的模型参数已经从10亿升级到70亿量级,其能力已经可以完成专业摄影级别的图片细节描绘。
“如影SenseAvatar”的2.0版数字人生成平台在语音和口型流畅度上较1.0版提升了30%以上,成功实现了4K高清视频的效果,同时还增加了生成形象和数字人歌唱的功能。而”琼宇SenseSpace”的2.0版则将空间重建效率提高了20%,渲染性能提升了50%,使得每100平方公里的场景建图时间缩短至38小时。”格物SenseThings”的2.0版在纹理和材质的还原上达到了毫米级的精细度,并成功突破了高反光和镜面物体采集的难题。
徐立介绍,依托大模型体系在底层技术上的快速迭代,商汤正在利用大模型的多模态能力赋能多个产业领域。
在金融领域,商汤科技积极与银行、保险、券商等金融机构展开深度合作,以数字人为基础,推动智能客服、智慧营销等多元化应用场景的落地。通过整合大语言模型的强大能力,商汤科技进一步拓展了投研分析、研报撰写等新的业务领域,实现了降本增效的目标。此外,借助金融知识库的赋能,数字人可以100%地根据客户产品说明书进行相关内容的问答输出,同时确保信息的及时更新,从而为用户提供更加精准、贴心的服务。
作为一名医疗场景中的人工智能助手,商汤科技凭借其深厚的医学知识和丰富的临床数据,成功构建了一款强大的人工智能工具——大医。在导诊、问诊、健康咨询以及辅助决策等多个医疗场景中,大医都能展现出强大的多轮对话能力。未来,它甚至将能够支持医学图像、文本和结构化数据等多模态的综合分析,进一步提升医疗语言的理解和推理能力,从而更好地服务于医疗领域。
结合“商量”2.0版与“秒画”3.0版的强大综合能力,我国企业不仅為移動終端客戶提供了多種智能交互解決方案,而且在以劉慈欣小說《三體》為故事藍本的《三体·引力之外》沉浸式科幻體驗空間中,商湯通過大模型的幫助突破了想像力的界限,創造出了一部充滿未來感的科幻旅程。
在智能汽车行业中,商汤科技集团的“绝影”智能座舱、智能驾驶以及车路协同等应用,在大模型的助力下,成功突破了创新界限。在智能座舱内,该系统通过整合多模态信息,如视觉、听觉等,实现对用户需求的全面感知。同时,通过对用户行为数据的标签化记录,能够更好地了解并满足用户的习惯与偏好,从而提供更为贴心的个性化服务。
在车辆舱外部,依靠“大模型 大装置”,“绝影”实现了端云协同的部署,统一了流量入口,能够满足私有化部署以及千万级别应用需求。最近,在2023年的CVPR(国际计算机视觉与模式识别会议)上,商汤科技与合作单位一同提出了名为UniAD的自动驾驶通用大模型,该模型以全局任务为目标,开创了新的自动驾驶大模型架构。此模型相关的论文荣获CVPR最佳论文奖,为自动驾驶技术与产业的发展指明了新的方向。
基于此,公司正在打造车路云协同的交通体系,借助多模态、多任务通用大模型开发路侧视觉感知大模型,并结合“琼宇”2.0版和“格物”2.0版,构建智能交通孪生与仿真,推动车路云共同向大模型的对话式交互模式演进。
栏目主编:黄海华
来源:作者:俞陶然
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!