“日日新:商汤大模型引领AI技术新潮流”
日日新

“日日新:商汤大模型引领AI技术新潮流”

这篇文章介绍了商汤科技在命名背后所蕴含的寓意,即希望模型能够不断更新,不断解锁更多的AGI(通用人工智能)可能性。商汤科技联合创始人、首席科学家王晓刚表示,商汤的AGI催生了“新的研究范式”,即通过强化学习和人类反馈,不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。在“日日新”大模型体系下,商汤创造了一系列生成式AI模型及应用,如AI文生图创作、2D/3D数字人生成、大场景/小物体生成等。此外,商汤还研发了一个名为“商量SenseChat”的语言大模型,该模型可以编写和调试代码、提供个性化医疗建议以及从复杂文档中提取和概括信息等功能。商汤为大模型体系提供API接口,包括图片生成、自然语言生成、视觉感知通用任务与自动化数据标注等服务,还可以提供大模型并行训练和模型增量训练服务,便于客户在大模型基础上进行自身垂直领域、行业的自定义模型开发等。
商汤科技“日日新”大模型体系:推动AI创新,引领AGI未来
日日新

商汤科技“日日新”大模型体系:推动AI创新,引领AGI未来

商汤科技发布“日日新SenseNova”大模型体系,包括中文语言大模型“商量SenseChat”、文生图生成模型“秒画SenseMirage”和AI数字人视频生成平台“如影SenseAvatar”等。该体系旨在为上下游提供一个大模型的“超市”,并为行业数据结合,实现行业落地闭环。商汤科技联合创始人陈宇恒表示,未来1至2年有信心追赶甚至超过GPT-4。
GPT崛起引发人工智能新浪潮,商汤科技发布“商汤日日新大模型”
日日新

GPT崛起引发人工智能新浪潮,商汤科技发布“商汤日日新大模型”

GPT的出现引发了人工智能的新浪潮,大模型和高算力成为衡量企业能力的标准。商汤科技推出大模型体系“商汤日日新大模型”,包括自然语言生成、文生图、感知模型标注及模型研发功能,内部实测代码编写效率提升62%,HumanEval测试集一次通过率40.2%。商汤科技还介绍了超10亿参数自研文生图生成模型“秒画”,支持二次元等多种生成风格,可通过单卡A100自训练并在平台上设置To B服务API。徐立表示,人工智能的能力由大模型参数量乘以训练数据量决定,商汤人工智能计算中心算力可达5000 p,支持20个千亿参数超大模型同时训练。商汤科技将坚定投入在通用人工智能(AGI)的前沿研发与商业化进程中。
大模型大算力引领AGI发展,商汤科技发布“日日新SenseNova”大模型体系
日日新

大模型大算力引领AGI发展,商汤科技发布“日日新SenseNova”大模型体系

今天,商汤科技在技术交流会上介绍了其以“大模型 大算力”战略推进AGI(通用人工智能)发展,并发布“日日新SenseNova”大模型体系。该体系涵盖自然语言处理、内容生成、自动化数据标注等多领域,包含多个大模型及能力,如“商量SenseChat”具备多轮对话和超长文本理解能力。借助AI大装置SenseCore,商汤科技已构建全栈的大模型研发体系,并在多个场景中落地。未来,他们将向行业伙伴提供多种大模型服务,共同推动通用人工智能技术突破。