《商量：商汤科技的语言大模型展现AGI之路》

文章主题：自然语言生成, 人工智能, 商汤科技, 日日新大模型体系

图说：语言大模型“商量”展示新民晚报记者郜阳摄

在AGI（通用人工智能）火得发烫的这个春天，商汤科技没有缺席。

在上海临港的人工智能计算中心（AIDC），“日日新”大模型体系，正式问世。

“日日新”名称的由来，源于《礼记·大学》中的“苟日新，日日新，又日新”一句，它体现了大模型的日新月异，不断进化的特性。这个庞大的模型体系拥有自然语言生成、内容生成、自动化数据标注以及自定义模型训练等多重功能，再结合决策智能大模型，共同推动实现通用人工智能（AGI）的目标。

在10日的技术交流会上，商汤科技不仅展示了其在语言建模领域的新成果——”商量”，这一模型作为”日日新”大模型体系的重要组成部分。此外，商汤还向大家展示了其文生图生成模型”秒画”，该模型能够快速生成高质量的文生图。同时，商汤也介绍了其AI数字人视频生成平台”如影”以及3D背景建筑生成平台”琼宇”和3D物体生成平台”格物”。这些创新产品充分展示了商汤科技在人工智能领域的深厚技术实力和广阔发展前景。

在商汤科技董事长兼CEO徐立看来，这是一次大模型的“超市开张”，提供了完整的产业链。

会处理问题也会学习新知

“帮我写一句语言大模型的广告标语，这个语言大模型的名字叫‘商量’。”

如今，人们对于最新研发出的语言大模型“商量”已经不再感到陌生。它的出现，使得语言成为了每个人的优势，为人们开启了无限的可能性。而这一切的实现，都源于与商量们的紧密合作。

在面对专利法的挑战时，程序员们不无忧虑地加载了相关PDF文件，针对当前的法规变化提出了一项重要问题：“今年专利法申请的周期，是否有所更新？”经过一番迟疑和思考，他们通过结合自身所学的新知识，给出了一个颇具深度的回答——或许最快速度的情况下，我们有望在两年内取得授权。

这款拥有1800亿级参数的中文大语言模型，在实际的互动过程中，不断优化其判断力和创作智能。在处理多轮对话、问诊以及编程等特定领域时，表现尤为出色，几乎涵盖了所有应用场景。此外，该模型还能实现知识的自动及时更新，为用户提供更加精确和实用的信息。

在探讨问诊技巧时，不得不提的是“商量”的高超技艺。一次，一位患者表示：“最近工作太过辛劳，导致眼睛都变得发黄了。”而非直接给出解答，它首先关心地询问：“是否还有其他身体不适的症状？”当患者回答有手掌发黄的情况，且已经持续了一个多月，它才小心翼翼地分析道：“这可能是黄疸的表现。”随后，它给出了专业的建议：“我们建议您尽快预约进行肝功能检查，同时请注意休息，保持健康的生活方式。”

“语言能力和推演能力的不断进步,”徐立强调,”将为我们与顶级医疗机构携手打造未来医疗服务场景铺就道路。我们的合作伙伴如新华医院所进行的随访服务，以及与嘉会医院共同推出的互联网问诊服务等都已经成功落地。”

“确实如此，”商量”这一功能不仅整合了”AI代码助手”，更在公司的内部试运行中展现了强大的效果。据数据显示，它的出现使得代码编写过程的效率提升了62%，而在测试集上的表现更是令人惊喜，一蹴而就地达到了40.2%的通过率。”这标志着一种全新的软件开发模式正在形成，即’AI for AI’的新范式。这种新范式下，预计将有80%的代码由AI来生成，这无疑是一次技术上的重大突破。”徐立不禁感慨万分。

据悉，“日日新”大模型体系已面向合作伙伴开展内测，未来主要面向B端业务。

“有天赋的运动员”

在商汤科技联合创始人、首席科学家王晓刚看来，大模型是个非常有天赋的运动员，在教练——人的调教下，不需要一招一式来示范，只需要“点拨”一番，这个天赋异禀的运动员就能完成新的动作。

“日日新”体系下文生图创作平台“秒画”的展示印证了他的看法。面对“生成有80年代港风特点的女生”特点的图片需求，“秒画”的第一次创作只可谓差强人意。没关系，那就给几张港风范满满的图片，没过一会，“秒画”又创作了新的作品。这一次，台下掌声雷动。

同样惊艳的还有AI数字人视频生成平台“如影”——仅需一段5分钟的真人视频素材，就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。

相比之下，过去的一些模型则是领域内的“专属模型”，它是一个刻苦的运动员，天赋没那么高，得“耐心地教”：一种教法是人工标注大量的数据，另一种则是高天赋的运动员在掌握新动作后，自动产生了很多数据，再“喂”给专属模型去学习。

“通用人工智能大模型带来了人工智能范式的一个变化。”王晓刚认为，它以极低的成本、非常高效的方式不断解决各个领域里新出现的各种开放性任务，并大幅提升了研发效率和人工智能覆盖的范围。

要知道，此前ChatGPT和GPT-4 能表现出高超的图片和语言理解能力，就是因为“涌现现象”——大模型的数规模达到一定程度时，其解决问题的能力就会发生突变——打个比分来说就是“大力出奇迹”，或者说就是“开窍了”。“一个强大的模型，能通过强化学习和人类反馈不断解锁新的能力，从而更高效地解决海量的开放式任务，实现从‘数据飞轮’到‘智慧飞轮’的演进。”王晓刚解释，这最终会达到“人机共智”，就有了延续的“涌现现象”。

算力支撑提供模型即服务

一个回避不了的问题摆在了商汤科技联合创始人、大装置事业群副总裁陈宇恒面前：在大模型领域，国内和国外差了多少？

“会有一点差距，但这段差距是可以很快追上的。”陈宇恒显得很有信心，“大模型技术依托的几大要素即为大算力、大数据和模型设计。”

“在AI大模型时代，数据、算法和算力这三要素在经历新的演变，大模型参数量将以指数级速率提升，而数据量随着多模态的引入也将大规模增长，因此必然会导致对算力需求的剧增。”徐立补充道。

当前业界训练大模型，对大算力的需求非常旺盛，而真正好用的基础设施却十分稀缺。在技术交流日的举办地：临港AIDC，就是历时5年建成的AI大装置，共有27000块GPU芯片卡，可以输出5.0 exaFLOPS的总算力，是亚洲目前最大的智能计算平台之一。而基于大装置的能力，商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型，持续演进能力并广泛支持各种应用。

事实上，就在上个月，商汤发布了开源社区多模态多任务通用大模型“书生2.5”，其拥有30亿参数，可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

记者了解到，基于AI大装置和“日日新”大模型体系，商汤将面向行业伙伴提供涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型即服务。

“基于预训练大模型的自动化数据标注可实现相较于人工数据标注近百倍的效率提升。”陈宇恒介绍，“而模型推理部署服务可将大模型推理效率提高100%以上，降低用模型提供服务的成本。”此外，商汤也向行业开发人员开放大量预训练模型及AI开发工具链，全面赋能开发效率。

这两年，AI的热点很多，先有元宇宙，再来大模型。对此，陈宇恒表示，元宇宙是人工智能大模型极佳的应用场景，也是多种技术的结合体。其中一系列大模型驱动的技术能力，可以很好解决元宇宙中内容制作成本过高的痛点。

“AI企业要发挥自己的优势，避免盲目跟风，持续地积累和沉淀，但要在机会来临的时候，快速敏锐地抓住。”陈宇恒说。

新民晚报记者郜阳

自然语言生成, 人工智能, 商汤科技, 日日新大模型体系

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复