商汤发布“日日新”大模型，科技巨头加速布局AI训练

在2023年4月11日早盘，科技公司商汤-W在港股市场上表现亮眼，商汤-W股价一度飙升超过8%，成交额市场领先。从近期表现来看，商汤-W近四个交易日累涨超30%。

来源：ifind商汤科技近期公布了多项与AI项目进展相关的利好消息，4月10日，商汤科技董事长兼首席执行官徐立宣布推出大模型体系“商汤日日新大模型”，包括自然语言生成、文生图、感知模型标注、以及模型研发功能。

此外，商汤科技还对外介绍了最新自研的中文语言大模型应用平台“商量SenseChat”。据了解，作为千亿级参数的自然语言处理模型，“商量SenseChat”使用大量数据训练，并充分考虑了中文语境，能够更好地理解和处理中文文本。

除商汤科技以外，另一互联网巨头阿里巴巴也在近期揭开了阿里版GPT”通义千问”的神秘面纱，在4月11日阿里云峰会现场中阿里云CTO周靖人向大家介绍了通义千问大模型。受到消息驱动，阿里巴巴-SW早盘股价一度涨超2%，近期公司股价表现较强，在3月份累计涨幅已经超过16%。

来源：ifind究竟这些国内科技公司在AI领域有何最新进展，在ChatGPT这类型产品蓬勃发展之下，又会利好哪些产业方向发展，我们来详细看看。

商汤发布“日日新 SenseNova”大模型体系

2023年4月10日，商汤科技举办技术交流日活动，发布了商汤的“日日新 SenseNova”大模型体系，包括自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

商汤科技表示，在商汤的顶级数据和算力支持之下，有望打造出出色的AGI（通用人工智能）基础设施。

首先在参数层面，商汤AGI的布局包括1800亿参数中文语言大模型“商量 SenseChat”，超过GPT-3（1750亿）、超10亿参数自研文生图生成模型“秒画”、320亿参数量的全球最大通用视觉模型。

其次在算力层面，商汤建设了业界领先的AI大装置SenseCore，其中共有27,000块GPU芯片，以英伟达A100为主，可以输出5.0 exaFLOPS的总算力，是亚洲目前最大的智能计算平台之一。

该算力可支持20个千亿参数超大模型同时训练，最高可支持万亿参数超大模型的训练。

商汤目前已建立全栈的大模型研发体系，并在多个行业场景中落地，场景的多样性、任务的复杂度、数据的丰富度均充分展示了商汤大模型的能力和未来潜力。

来源：商汤在B端方面，商汤采用MaaS模式深度挖掘大模型价值。

基于商汤AI大装置 SenseCore 和“日日新 SenseNova”大模型体系，商汤面向行业伙伴提供一系列大模型即服务（Modelas-a-Service），包括自动化数据标注、自定义大模型并行训练、模型增量训练、模型推理部署以及开发者效率提升等服务。

借助预训练大模型的自动化数据标注，相较于人工数据标注，效率可提升近百倍。此外，大模型并行训练和模型增量训练服务有助于客户快速利用自有数据训练模型，实现垂域行业模型的开发与自定义模型的生产。

模型推理部署服务则能将大模型推理效率提高100%以上，降低模型服务成本。商汤还向行业开发人员提供大量预训练模型及AI开发工具链，全面赋能客户提升开发效率。

“商量”AI 代码助手的核心功能：

来源：商汤在应用方面，商汤还配套了丰富的AGI应用产品。

我们在此次商汤“日日新 SenseNova”看到，其也具有各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用：

例如“秒画 SenseMirage”文生图创作平台，展现了光影真实、细节丰富、风格多变的文生图能力，可支持6K高清图生成；客户还可根据自身需求训练生成模型。

通过增量训练得到自定义LoRA模型：

来源：商汤像“如影 SenseAvatar”AI 数字人视频生成平台，仅需一段5分钟的真人视频素材，就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

“如影”可以快速制作数字人视频：

来源：商汤“琼宇 SenseSpace”和“格物 SenseThings”3D内容生成平台，可以高效低成本生成大规模三维场景和精细化的物件，为元宇宙、虚实融合应用打开新的想象空间。商汤生成式 AI系列应用实现人、物、场的便捷编辑创作：

来源：商汤

阿里通义千问支持API

首批接入OPPO、吉利汽车等

在4月11日举办的阿里云峰会现场，阿里云CTO周靖人揭开了通义家族新成员、阿里版GPT”通义千问”的神秘面纱。

据周靖人介绍，通义千问是一个超大规模的语言模型，能进行多轮交互及复杂指令理解，同时可多模态融合，并支持外部增强API。目前，首批接入的合作企业包括OPPO、太平洋保险、吉利汽车、奇瑞、可口可乐、波司登等。

来源：阿里云峰会“通义千问不仅能进行多轮对话，可根据上下文语义理解更精准地回答问题，也可以做文案创作，包括小说的编写甚至企业策划，帮助大家增加工作效率。”

周靖人表示，”另外它还有一定的逻辑推理能力，可以做些简单的数学题，或者代码编写。而且，它能进行多模态融合，并且一开始就设计成一款多语言的产品体系，可以自动进行中英文及其他语种之间的交互。”

周靖人强调，通义千问可提供多种模型接入、调用方式，能够结合自身能力帮助企业实现专属大模型。”企业能把个性化诉求加入到模型里，真正参与到模型的开发和定制中来。

甚至不需要大家去做复杂的模型训练，所有的模型都能通过自动化生成。阿里还可以提供完善的API开发流程，所有这一系列都能自动化探索和创新，真正意义上把通义千问的能力发挥出来，解决各行业的实际问题。”

来源：阿里云峰会

实际上早在4月7日，阿里云就宣布自研大模型“通义千问”开启企业邀测。通义千问在文字创作、多语言能力、数理计算、代码撰写等方面表现良好。

此外，通义千问配备小应用合集“百宝袋”，为特定领域任务而定制AI模块，包括商品描述生成、SWOT分析、提纲撰写等。

阿里云已推出全栈智能计算解决方案「飞天智算平台」，可将计算资源利用率提高3倍以上，AI训练效率提升11倍，推理效率提升6倍。

不仅阿里和商汤，国内科技巨头公司华为近期也发布具有稀疏架构的大型语言模型PanGu-Σ，参数量多达1.085万亿，并在100天内仅用512个昇腾910AI加速器和3290亿token训练完成。

可以看到国内大模型竞赛已延伸到算力层面，各巨头开启差异化竞争培育品牌护城河，AI竞赛日趋激烈。

AI算力需求暴增，IDC行业有望受益

在ChatGPT横空出世以后，各大科技公司加速研发和发布类似产品和应用，持续催化之下下，国内AI算力需求则有望保持较强增长势头。

根据数据显示，ChatGPT的总算力消耗约为3640PF-days（即假如每秒计算一千万亿次，需要计算3640天），需要7-8个投资规模30亿、算力500P的数据中心支撑运行。

在数字经济时代背景下，全球数据总量和算力规模持续呈现高速增长态势。从需求上看，2022年我国智能算力规模达到268百亿亿次/秒（EFLOPS），超过通用算力规模；有机构预计未来5年，我国智算规模的年复合增长率将达52.3%。

智算力资源作为数字经济发展的重要底座，数字化新事物、新业态、新模式推动应用场景向多元化发展，算力规模的不断扩大带动算力需求持续攀升。

据工信部数据披露，2022年全国在用数据中心机架总规模超过650万标准机架；近5年，算力总规模年均增速超过25%。

当算力在千行百业落地应用时,不同精度的算力需要“适配”多样化的应用场景。尤其是随着人工智能技术的高速发展，算力结构随之演化，对智能算力的需求与日俱增。

从政策层面看，我国一直高度重视AI产业发展，智能算力发展的基础逐渐夯实。2022年2月，四部委再次联合印发通知，同意在8地启动建设国家算力枢纽节点，并规划10个国家数据中心集群。

至此，全国一体化数据中心体系完成总体布局设计，随着“东数西算”工程全面实施，智算中心建设也进入了加快发展的新阶段。

根据分析师指出数据中心作为数据枢纽和应用载体，是人工智能发展的基础，长期来看数据中心需求有望恢复。弗若斯特沙利文预计2024年IDC市场规模达6123亿元，2022-2024年复合增速达15.9%，数据中心将进入新一轮上升期。投资者可以关注以IDC为核心的龙头厂商如数据港、万国数据/万国数据-SW。

不过投资者仍然需要注意，如ChatGPT产品中这样的智能AI技术目前仍在不断发展完善中，未来也会面对研发不确定性以及法律法规的潜在规范，与此同时短期市场部分概念股涨幅较大，一些公司产品仅仅停留在初级测试和宣传阶段，投资者也需要谨慎观察对待，注意投资风险。

重要提示及免责声明：本文乃由复星财富国际控股有限公司(“复星财富”) 的全资子公司复星国际证券有限公司（以下简称 “复星国际证券”）发布。本文仅提供予接收人，其所载的信息、材料或分析工具仅提供予接收人信息并做作参考之用，不存有招揽或邀约购买或出售证券的意图。未经复星国际证券事先书面许可，接收人不得以任何方式修改、发送或复制本文及其所包含的内容予其他人士。复星国际证券相信本文所载资料及观点的出处均属可靠，复星国际证券不会就本文的真实、准确及完整性作出任何保证。接收人在作出投资决定前，应自行分析或咨询专业顾问的意见。除非法律法规有明确规定，复星国际证券或其任何董事、雇员或代理人概不就任何第三方因使用/依赖本文所载内容而导致的任何直接的、间接的损失承担任何责任。本文所载的资料及观点如有任何更改，复星国际证券并不会另行通知。

相关文章

发表回复 取消回复

发表回复取消回复