文章主题:商汤科技, 大模型体系, 日日新SenseNova, 中文语言大模型

666AI工具大全,助力做AI时代先行者!

在4月10日的 press release 中,商汤科技正式推出了其全新的“日日新”大模型体系,这一体系涵盖了多个领域,包括1800亿参数的中文语言大模型“商量SenseChat”以及10亿参数的文生图生成模型“秒画SenseMirage”。此外,该体系还包括AI数字人视频生成平台“如影SenseAvatar”,以及3D内容生成平台“琼宇SenseSpace”和“格物SenseThings”等。这些生成式AI模型及应用的发布,标志着商汤科技在大模型服务领域的重大突破。

商汤科技董事长兼CEO徐立宣布,他们的大模型体系将被命名为了“日日新SenseNova”。这个名称的寓意是“苟日新、日日新、又日新”,它象征着在模型的迭代速度和解决问题的能力上,能够持续地取得进步和更新。他希望这个体系能够在不断探索AGI(通用人工智能)的更多可能性方面发挥重要作用。徐立还形象地将“日日新”比喻为一个永不停歇的超市,其中会产生越来越多的庞大模型。

陈宇恒,商汤科技联合创始人以及大装置事业群副总裁,在最近的采访中明确表示,他对公司在未来1至2年内追逐甚至超越GPT-4的目标充满信心。

我们致力于构建更大规模的人工智能模型,目前我们的目标是实现千亿级别的模型参数,未来甚至可能达到万亿级。通过增强算力和提升模型规模,我们将打造更为强大的智能系统,为各类产品和工具的用户体验提供人工智能驱动引擎。

“日日新”大模型超市首亮相

商汤科技所提出的“日日新”大模型体系是一个多层次的结构,包括基础大模型、领域大模型和基于行业数据的实际应用。这一体系的基础部分是基础大模型,其功能在于提供强大的计算能力和基本的人工智能功能。在基础大模型的基础上,领域大模型被引入,它能够根据特定领域的数据和需求进行定制化建模,从而实现更高精度的预测和决策。最后,通过将基础大模型和领域大模型相结合,并利用行业数据,形成了实际的行业落地闭环,从而实现了对行业问题的深度理解和高效解决。

在徐立先生的介绍下,商汤科技成功推出了“日日新”大模型体系,这使得商汤相当于为整个产业链的上游和下游提供了一个集数据、模型训练及部署于一体的“一站式超市”。这个大模型体系成为了上下游合作伙伴共同依赖的基础,为双方的合作打下了坚实的基础。

作为自然语言基础大模型,商汤发布的“商量SenseChat”拥有1800亿参数,具备问答、理解与生成等中文语言能力,支持超长文本知识理解。在现场演示中,“商量”化身为编程助手,帮助开发者高效地编写和调试代码。

同时,商汤也展示了各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用。

其中,“秒画SenseMirage”文生图创作平台,支持6K高清图的生成。用户还可根据自身需求训练生成模型。比如,输入数张90年代香港女星的照片,“秒画”就能通过自主学习,生成用户所需的“港风”图像;

“如影SenseAvatar”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,即可生成出来声音及动作自然、口型准确、多语种精通的数字人分身;

“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台,则可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。

“基于千亿级参数的基础大模型,我们演化出文生图大模型、代码大模型、语言大模型等领域大模型。”陈宇恒说。“在这些领域大模型之上,会提供API以及UI,可以让用户与这些大模型进行交互。商汤现有的模型库提供了上万个不同特色的文生图模型,能应用在多个行业,也是商汤在大模型领域长期的积累。”

算力是大模型发展的关键,被称为人工智能时代的“石油”。商汤这次展示的1800亿参数中文语言大模型,正是得益于商汤在算力布局上的深厚积累。据悉,商汤人工智能计算中心可输出5.0 exaFLOPS的总算力,能支持20个千亿参数超大模型同时训练。

“我们有超过27000张的GPU卡,可并行地训练20个以上的ChatGPT类模型,使研发节奏能非常快地追赶世界领先水平。在今年,我们会做到3000-4000张的算力基础设施,预计明年也会达到万卡级。” 陈宇恒提到。

陈宇恒强调,商汤在算力、人才等各方面的积累,都不会过于落后OpenAI。“甚至算力层面,我们和OpenAI是站在同一起跑线上的。包括在大模型的研发层面,也有很多年的积累。”

因此对于追赶OpenAI ,陈宇恒表达了比较乐观的态度。“我们要做出中国特色的人工智能大模型,符合国内用户习惯、符合整体产品体验的大模型。有了这样的大方向,对于未来1到2年,我们追赶甚至超过GPT-4,我是比较有信心的。”

着重B端应用布局

在发布会现场,徐立演示了“商量”大语言模型在医疗服务领域的应用。比如,用文字输入对症状的描述,由AI医生给出初步的病情判断,指导病人去医院相关的科室就医。

徐立介绍,商汤已经与新华医院、瑞金医院、华西医院等在辅助诊疗、随访、健康咨询等方面开展合作。

“公司这些年把重点在B端服务客户。而C端的现象级产品,让更多人知道了人工智能大模型,并认可其发展潜力。”陈宇恒表示,“这反而是对商汤在相关的产品、技术战略有很强的支撑印证。说明我们一直在做一件正确的事情。”

迄今,商汤的大模型已覆盖核心公司业务,涵盖智能汽车、智慧生活、智慧城市、智慧商业。

在智能汽车领域,2022年,绝影智能车舱和智能驾驶产品完成了27款车型的适配和量产交付,量产交付数超50万辆,新增定点数超800万辆,持续领跑行业。通过人工智能大模型赋能的辅助驾驶以及智能车舱的产品研发,共覆盖30多家车企的80多款车型。

在元宇宙领域,商汤推出的数字人产品,融合了文本生成图像等大语言模型的一系列技术,亦形成了行业落地。2022年初,商汤和宁波银行展开了深度合作,打造了数字员工“小宁”,通过拟人的客服形象,为银行客户提供各类业务知识和办理的服务。同时通过一套虚拟的IP解决方案,集成了各种AI技术,实现高效率、低成本的AIGC内容创作。

在AI for Science的科研领域,商汤也与生物企业达成合作,为蛋白质结构的大模型研发提供训练和推理的优化服务。“我们把预测时间缩短了60倍,大幅度地提高了蛋白质结构预测的抗体筛选效率,这都是商汤大装置结合各个行业,来形成一些垂直解决方案,以及带来的真实的B端价值的案例。”陈宇恒介绍。

AI 将赋能各行各业

随着大模型的发展,AI对各行各业的赋能被认为是未来的新爆发点。商汤则希望在此过程中形成大模型生态,与各行业的企业联合共赢。

“真正地把AI的能力去输出到各行各业,让我们的用户和客户提前体验到人工智能技术发展的红利。” 陈宇恒指出。

在算力层,商汤已有超过7000张GPU算力,对外服务于8家大型客户进行大模型训练;

在MaaS(模型即服务)领域,商汤提供推理平台、模型管理平台、数据平台等,以及加速人工智能大模型生产效率的整套工具链,帮助行业客户高效地开发人工智能大模型;

此外,商汤还开放模型即服务的API,让游戏、互联网、银行、科研机构等客户,以调用API的方式,把大模型的能力应用在其产品上。

“用户可以重新训练大模型,也可以在我们提供的大模型上微调,商汤会提供整套工具链。同时,我们也会给予现成的Model-as-a-Service的 API ,让用户直接调用。通过不同的产品和服务组合,满足不同技术能力的用户诉求。” 陈宇恒表示。

大型通用模型研发和训练成本高昂,是阻碍其落地的一大门槛。但如果把大模型的能力迁移至小模型上,就能进一步降低落地成本。

“比如训练一个超大模型,再外挂小一点的模型。通过小模型的微调和训练,把大模型的推理成本分摊下去。这样,行业知识通过小一点的模型去解决,从而提高推理侧商业落地的投资回报率和性价比。” 陈宇恒说。

大模型时代的到来,将推动人工智能开发从“零散的小作坊”到“大规模工业化生产”的升级,更好地实现技术和商业的平衡,让 AI 加速赋能各行各业。

“小模型时代模型生产的方法,类似传统的小作坊。人工智能大模型的出现后,其最大的特点是泛化能力非常强,更直接地服务于各行各业。不再像以前,需要做大量的手动优化或者重新训练的工作。这会导致人工智能的应用成本急剧地降低,是商业模式上的很大转变。” 陈宇恒解释。

展望未来,商汤将剑指更大规模的基础模型研发。

“在不断接近所谓的通用人工智能的道路上,势必要把基础模型越做越大。作为人工智能的头部的企业,我们肯定会挑战更大的模型。这是未来2到3年,整个无论从学术界还是从工业界,还是从我们自身对AI的理解上,都是比较明确的方向。” 陈宇恒透露。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注