文章主题:GPT, 人工智能, 商汤科技, 大模型
GPT的出现引发了人工智能领域自很久以来的又一次繁荣,”颠覆性的变革”正在逐步展开。如今,拥有超大型模型和高算力的能力已经逐渐成为评估一家AI公司实力的重要指标。
在4月10日的技术交流会上,商汤科技董事长兼CEO徐立正式对外公布了一项重大计划:该公司即将推出一款名为“商汤日日新大模型”的产品,这是一个包含自然语言生成、文生图、感知模型标注和模型研发功能的综合性大模型体系。
“日日新”取自《礼记·大学》:“汤之盘铭曰:苟日新,日日新,又日新。”
商汤还宣布推出商汤自研中文语言大模型应用平台“商量 SenseChat”。
徐立介绍称,商量是一个1800亿参数的中文大语言模型,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等,并在现场演示了其作广告语、续写儿童故事、编程等功能,下图为商汤大模型实时演示:
徐立透露,经过内部实测,代码编写效率提升了62%, HumanEval测试集的了一次通过率达到了40.2%。他进一步阐述指出,下一代软件开发的新模式是AI for AI,在这一模式下,代码的80%由AI自动生成,仅有20%由人工参与。
商汤科技进一步拓展了其技术领域,推出了超过10亿参数的自研文生图生成模型“秒画”。该模型能够支持二次元等多种生成风格,并以极快的速度生成高质量图片。具体来说,单卡A100可以支持这一模型,仅仅只需要2秒钟就能生成一张512K分辨率的图片。对于用户而言,他们可以根据自己的需求利用单卡A100进行自训练,从而更好地满足自身的需求。除此之外,商汤科技还依托于平台发布了一系列的模型,并提供了相应的B服务API(应用程序编程接口)。这样,商汤科技就可以借助自身强大的大算力,将服务提供给更多的客户,实现服务的最大化利用。
徐立强调,人工智能的性能取决于其模型的规模和所使用的训练数据量。作为商汤人工智能计算中心的优势之一,该中心具备强大的算力,能够支持20个拥有千亿参数的超大模型同时进行训练。
徐立此前曾表示,商汤将通用人工智能(AGI)作为核心发展战略,以期在未来几年内实现重大突破:
人工智能是一个前景广阔的赛道,商汤将一如既往地坚定投入在迈向通用人工智能的前沿研发与商业化进程中。
商汤SenseCore庞大的算力输出能力
徐立在交流会上指出,人工智能的性能取决于其模型的参数量与训练数据的规模。商汤人工智能计算中心的算力高达5000 p,目前能够支持20个拥有千亿参数的超大模型同时进行训练。
根据商汤3月28日公布的财报显示,服务于大模型训练的商汤SenseCore AI大装置,目前已支持8家客户进行大模型训练,总共提供了7000多张GPU卡。
SenseCore已支持了超过10个大模型训练项目,包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。
从算力能力上看,年内,商汤SenseCore AI大装置在持续进行扩建,共计完成了2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力。
目前该装置可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。
商汤科技联合创始人兼首席科学家王晓刚教授在此前接受媒体采访时表示,商汤多年人才和技术积累使其具有与OpenAI相比非常类似的优势:
商汤有非常多的研发人员能深入到一线,用模型去解决实际问题,有很好的积累。‘好的原材料’就是要深入到各个行业里积累非常多的know-how。美国公司OpenAI能够把ChatGPT做出来,背后也有多年积累,从小模型到大模型的研发,中间积累了非常多的know-how。”
王晓刚教授指出,深度学习一下子颠覆了所有传统,现在的关键是“拥抱全新研究范式”和“转变观念”:
颠覆会不断出现,且以非常快的速度出现。现在重新有了一个机会。这对于整个行业发展非常好。
十年前,商汤还没有诞生,我们创始团队在当时做的决定就是-All in deep learning。我们之前在传统视觉技术里也有较长积累,但是,当新技术来了,我们就果断地去拥抱新技术。今天也一样。”
本文来自华尔街见闻,欢迎下载APP查看更多
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!