商汤科技推出大模型体系及中文语言大模型应用平台
日日新

商汤科技推出大模型体系及中文语言大模型应用平台

智通财经APP消息,商汤-W(00020)早盘高开近9%,报3.62港元,成交额3.24亿港元。消息面上,商汤科技董事长兼首席执行官徐立宣布推出大模型体系“商汤日日新大模型”,包括自然语言生成、文生图、感知模型标注、以及模型研发功能。此外,商汤科技还介绍了最新自研的中文语言大模型应用平台“商量SenseChat”。
商汤推出大模型体系“日日新”,迎接AGI时代
日日新

商汤推出大模型体系“日日新”,迎接AGI时代

4月10日下午,在商汤技术交流日活动上,商汤科技董事长兼首席执行官徐立宣布推出大模型体系“商汤日日新大模型”,取自《礼记·大学》,汤之盘铭:苟日新,日日新,又日新。“日日新”大模型体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发功能。 此外,商汤科技还对外介绍了最新自研的中文语言大模型应用平台“商量SenseChat”,据悉,作为千亿级参数的自然语言处理模型,“商量SenseChat”使用大量数据训练,并充分考虑了中文语境,能够更好地理解和处理中文文本。 01. 1800亿参数中文语言大模型应用平台“商量” 活动现场,“商量SenseChat”展示了多轮对话和超长文本的理解能力。商汤现场展示了中文语言大模型写作广告语、续写儿童故事、编程等。编程核心功能包括代码补全、扩写、翻译、重构、修正,以及注释生成代码、复杂度分析、测试用例生成等。徐立表示,内部实测代码编写效率提升62%,HumanEval测试集一次通过率40.2%。下一代软件开发范式是AI for AI,代码=80%AI生成+20%人工。 同时,在智慧医疗方面,“商量”也表现出色。商汤科技与新华医院、郑大一附院、华西医院等多家顶尖医院合作,提供随访、健康咨询、互联网问诊、辅助医疗等服务,通过不断演进的语言理解和推演能力,打造未来医疗服务场景。 02. 超10亿参数自研文生图生成模型“秒画” 超10亿参数自研文生图生成模型“秒画”,支持二次元等多种生成风格。单卡A100支持,2秒生成1张512K分辨率的图片。用户可基于单卡A100自训练。基于平台发布的模型,可设置to B服务API(应用程序编程接口),结合商汤大算力对外提供服务。 03. 3D内容生成平台“琼宇”(场景生成)、“格物”(物体生成) 此外,商汤科技对外发布3D内容生成平台“琼宇”(场景生成)、“格物”(物体生成),基于3D内容生成技术对空间和物体的复刻与交互。100平方公里城市级生成,“琼宇”用时2天,具有厘米级重建精度,还原场景的真实细节和光照效果,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。 04. “大模型+大装置”先行者 GPT的诞生引燃了沉寂许久的人工智能新浪潮,其本质是大模型成为主流路线在人工智能领域的验证。向上游来看,大模型训练需要强大算力支撑,这正是商汤多年积累的领域。 服务于大模型训练的商汤SenseCore AI 大装置,目前已支持8家客户进行大模型训练,总共提供了7000多张GPU卡。SenseCore已支持了超过10个大模型训练项目,包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。 在国内人工智能领域,商汤大装置所提供的高性能计算名列前茅。 据悉,SenseCore AI大装置年内持续扩建,完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力。目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。 财报显示,去年商汤研发支出40亿元,同比增长11%,截至2022年12月31日,公司的研发队伍达3466人,占员工总数的68%。;研发人效相比去年进一步提高90%,人均每年研发模型数9.35个,累计商用模型数提高了93%至6.7万个。 其中在计算机视觉领域,商汤成功研发了320亿参数量的全球最大的通用视觉模型,实现了高性能的目标检测、图像分割和多物体识别算法,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。 商汤科技的AI基础设施SenseCore商汤大装置中包含了AI原生基础设施层、深度学习平台层、算法模型层,打通了算力、平台、算法。基于SenseCore,商汤科技可以将不同技术层集中建设、按需调配,从而为千行百业提供解决方案,降低AI模型应用的边际成本,将领先的AI技术下沉到关键垂直领域中。 05. 迎战新一轮AI潮爆发 2023年,由AIGC及ChatGPT引领的新一轮人工智能热潮已箭在弦上。站在2023年起点回看商汤此前积累,可以发现其走的每一步都坚实而有意义。 大模型+大装置的路线是商汤一直以来的技术壁垒和竞争优势。 在基础设施的支撑下,商汤得以在智能汽车和智慧生活取得高速增长。而汽车和生活(AIGC)是当下人工智能热门落地场景,也就是说,在GPT引领的浪潮到来之前,商汤已在相关领域完成了初步市场积累,走在了行业前面。 商汤以通用人工智能(AGI)作为核心发展方向,以期在未来几年内实现AGI技术的重大突破。 以SenseCore AI大装置为主的大模型生产核心平台,将持续扩展大装置的能力,包括投资高性能计算基础设施例如高速网络、大规模数据存储以及强大的计算节点。而大模型方面,商汤将多模态大模型的研发作为战略投入方向。这类模型能够处理多种数据类型,包括文本、图像、音频和视频,具有更强的数据理解和生成能力,和多任务泛化能力。 AGI不仅是商汤的使命,更是DeepMind和OpenAI等领先人工智能企业的共同使命。而ChatGPT为AGI撕开了第一个口子,人工智能或许正加速进入AGI的新发展阶段。 技术革命真正的爆发节点,或许没有人能给出准确答案,但如商汤一样的长期主义者,将永远是重要推动者。 文章综合整理自网络,仅供阅读参考。 参考来源: 澎湃新闻《商汤发布“日日新”大模型体系,含“商量”“秒画”“琼宇”“格物”》 36氪财经《商汤科技先发制人,「大模型+大装置」构建AI壁垒》