商汤科技发布“日日新SenseNova”大模型体系，推动AI技术日日更新

文章主题：商汤科技, 大模型体系, 日日新SenseNova, 中文语言大模型

在4月10日的 press release 中，商汤科技正式推出了其全新的“日日新”大模型体系，这一体系涵盖了多个领域，包括1800亿参数的中文语言大模型“商量SenseChat”以及10亿参数的文生图生成模型“秒画SenseMirage”。此外，该体系还包括AI数字人视频生成平台“如影SenseAvatar”，以及3D内容生成平台“琼宇SenseSpace”和“格物SenseThings”等。这些生成式AI模型及应用的发布，标志着商汤科技在大模型服务领域的重大突破。

商汤科技董事长兼CEO徐立宣布，他们的大模型体系将被命名为了“日日新SenseNova”。这个名称的寓意是“苟日新、日日新、又日新”，它象征着在模型的迭代速度和解决问题的能力上，能够持续地取得进步和更新。他希望这个体系能够在不断探索AGI（通用人工智能）的更多可能性方面发挥重要作用。徐立还形象地将“日日新”比喻为一个永不停歇的超市，其中会产生越来越多的庞大模型。

陈宇恒，商汤科技联合创始人以及大装置事业群副总裁，在最近的采访中明确表示，他对公司在未来1至2年内追逐甚至超越GPT-4的目标充满信心。

我们致力于构建更大规模的人工智能模型，目前我们的目标是实现千亿级别的模型参数，未来甚至可能达到万亿级。通过增强算力和提升模型规模，我们将打造更为强大的智能系统，为各类产品和工具的用户体验提供人工智能驱动引擎。

“日日新”大模型超市首亮相

商汤科技所提出的“日日新”大模型体系是一个多层次的结构，包括基础大模型、领域大模型和基于行业数据的实际应用。这一体系的基础部分是基础大模型，其功能在于提供强大的计算能力和基本的人工智能功能。在基础大模型的基础上，领域大模型被引入，它能够根据特定领域的数据和需求进行定制化建模，从而实现更高精度的预测和决策。最后，通过将基础大模型和领域大模型相结合，并利用行业数据，形成了实际的行业落地闭环，从而实现了对行业问题的深度理解和高效解决。

在徐立先生的介绍下，商汤科技成功推出了“日日新”大模型体系，这使得商汤相当于为整个产业链的上游和下游提供了一个集数据、模型训练及部署于一体的“一站式超市”。这个大模型体系成为了上下游合作伙伴共同依赖的基础，为双方的合作打下了坚实的基础。

作为自然语言基础大模型，商汤发布的“商量SenseChat”拥有1800亿参数，具备问答、理解与生成等中文语言能力，支持超长文本知识理解。在现场演示中，“商量”化身为编程助手，帮助开发者高效地编写和调试代码。

同时，商汤也展示了各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用。

其中，“秒画SenseMirage”文生图创作平台，支持6K高清图的生成。用户还可根据自身需求训练生成模型。比如，输入数张90年代香港女星的照片，“秒画”就能通过自主学习，生成用户所需的“港风”图像；

“如影SenseAvatar”AI数字人视频生成平台，仅需一段5分钟的真人视频素材，即可生成出来声音及动作自然、口型准确、多语种精通的数字人分身；

“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台，则可以高效低成本生成大规模三维场景和精细化的物件，为元宇宙、虚实融合应用打开新的想象空间。

“基于千亿级参数的基础大模型，我们演化出文生图大模型、代码大模型、语言大模型等领域大模型。”陈宇恒说。“在这些领域大模型之上，会提供API以及UI，可以让用户与这些大模型进行交互。商汤现有的模型库提供了上万个不同特色的文生图模型，能应用在多个行业，也是商汤在大模型领域长期的积累。”

算力是大模型发展的关键，被称为人工智能时代的“石油”。商汤这次展示的1800亿参数中文语言大模型，正是得益于商汤在算力布局上的深厚积累。据悉，商汤人工智能计算中心可输出5.0 exaFLOPS的总算力，能支持20个千亿参数超大模型同时训练。

“我们有超过27000张的GPU卡，可并行地训练20个以上的ChatGPT类模型，使研发节奏能非常快地追赶世界领先水平。在今年，我们会做到3000-4000张的算力基础设施，预计明年也会达到万卡级。” 陈宇恒提到。

陈宇恒强调，商汤在算力、人才等各方面的积累，都不会过于落后OpenAI。“甚至算力层面，我们和OpenAI是站在同一起跑线上的。包括在大模型的研发层面，也有很多年的积累。”

因此对于追赶OpenAI ，陈宇恒表达了比较乐观的态度。“我们要做出中国特色的人工智能大模型，符合国内用户习惯、符合整体产品体验的大模型。有了这样的大方向，对于未来1到2年，我们追赶甚至超过GPT-4，我是比较有信心的。”

着重B端应用布局

在发布会现场，徐立演示了“商量”大语言模型在医疗服务领域的应用。比如，用文字输入对症状的描述，由AI医生给出初步的病情判断，指导病人去医院相关的科室就医。

徐立介绍，商汤已经与新华医院、瑞金医院、华西医院等在辅助诊疗、随访、健康咨询等方面开展合作。

“公司这些年把重点在B端服务客户。而C端的现象级产品，让更多人知道了人工智能大模型，并认可其发展潜力。”陈宇恒表示，“这反而是对商汤在相关的产品、技术战略有很强的支撑印证。说明我们一直在做一件正确的事情。”

迄今，商汤的大模型已覆盖核心公司业务，涵盖智能汽车、智慧生活、智慧城市、智慧商业。

在智能汽车领域，2022年，绝影智能车舱和智能驾驶产品完成了27款车型的适配和量产交付，量产交付数超50万辆，新增定点数超800万辆，持续领跑行业。通过人工智能大模型赋能的辅助驾驶以及智能车舱的产品研发，共覆盖30多家车企的80多款车型。

在元宇宙领域，商汤推出的数字人产品，融合了文本生成图像等大语言模型的一系列技术，亦形成了行业落地。2022年初，商汤和宁波银行展开了深度合作，打造了数字员工“小宁”，通过拟人的客服形象，为银行客户提供各类业务知识和办理的服务。同时通过一套虚拟的IP解决方案，集成了各种AI技术，实现高效率、低成本的AIGC内容创作。

在AI for Science的科研领域，商汤也与生物企业达成合作，为蛋白质结构的大模型研发提供训练和推理的优化服务。“我们把预测时间缩短了60倍，大幅度地提高了蛋白质结构预测的抗体筛选效率，这都是商汤大装置结合各个行业，来形成一些垂直解决方案，以及带来的真实的B端价值的案例。”陈宇恒介绍。

AI 将赋能各行各业

随着大模型的发展，AI对各行各业的赋能被认为是未来的新爆发点。商汤则希望在此过程中形成大模型生态，与各行业的企业联合共赢。

“真正地把AI的能力去输出到各行各业，让我们的用户和客户提前体验到人工智能技术发展的红利。” 陈宇恒指出。

在算力层，商汤已有超过7000张GPU算力，对外服务于8家大型客户进行大模型训练；

在MaaS（模型即服务）领域，商汤提供推理平台、模型管理平台、数据平台等，以及加速人工智能大模型生产效率的整套工具链，帮助行业客户高效地开发人工智能大模型；

此外，商汤还开放模型即服务的API，让游戏、互联网、银行、科研机构等客户，以调用API的方式，把大模型的能力应用在其产品上。

“用户可以重新训练大模型，也可以在我们提供的大模型上微调，商汤会提供整套工具链。同时，我们也会给予现成的Model-as-a-Service的 API ,让用户直接调用。通过不同的产品和服务组合，满足不同技术能力的用户诉求。” 陈宇恒表示。

大型通用模型研发和训练成本高昂，是阻碍其落地的一大门槛。但如果把大模型的能力迁移至小模型上，就能进一步降低落地成本。

“比如训练一个超大模型，再外挂小一点的模型。通过小模型的微调和训练，把大模型的推理成本分摊下去。这样，行业知识通过小一点的模型去解决，从而提高推理侧商业落地的投资回报率和性价比。” 陈宇恒说。

大模型时代的到来，将推动人工智能开发从“零散的小作坊”到“大规模工业化生产”的升级，更好地实现技术和商业的平衡，让 AI 加速赋能各行各业。

“小模型时代模型生产的方法，类似传统的小作坊。人工智能大模型的出现后，其最大的特点是泛化能力非常强，更直接地服务于各行各业。不再像以前，需要做大量的手动优化或者重新训练的工作。这会导致人工智能的应用成本急剧地降低，是商业模式上的很大转变。” 陈宇恒解释。

展望未来，商汤将剑指更大规模的基础模型研发。

“在不断接近所谓的通用人工智能的道路上，势必要把基础模型越做越大。作为人工智能的头部的企业，我们肯定会挑战更大的模型。这是未来2到3年，整个无论从学术界还是从工业界，还是从我们自身对AI的理解上，都是比较明确的方向。” 陈宇恒透露。

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复