《ChatGLM3：新一代语言模型引领人工智能技术创新》

文章主题：自然语言处理, 人工智能模型, 智谱AI, ChatGLM3

（图片来源：unsplash）

钛媒体App获悉，10月27日下午举行的中国计算机大会（CNCC2023）一场论坛上，阿里、腾讯投资的人工智能（AI）独角兽公司智谱 AI 正式发布全新自研的第三代基座大模型ChatGLM3系列。

新版本的ChatGLM3包含ChatGLM3-1.5B（15亿）、3B和6B参数三种形式，其表现不仅在于多模态理解、代码模块、网络搜索等方面的小幅提升，更显著的是推理速度相对于最佳开源模型的提升幅度达到了2-3倍。此外，通过集成自研的AgentTuning技术，ChatGLM3在智能规划和执行方面的性能比ChatGLM-2提升了1000%。值得一提的是，ChatGLM3还借助了华为昇腾生态的优势，使得算力推理速度实现了3倍以上的提升。

智谱AI的CEO张鹏阐述，他们研发的最新模型ChatGLM3旨在提升跨模态能力，针对的是GPT-4V（即多模态版本的GPT-4）。这一技术升级代表了ChatGLM系列的全新进化。

“对标OpenAI是智谱 AI 成立以来的目标。智谱 AI 致力于让机器像人一样思考，我们希望利用ChatGLM3通用基座模型能力，与合作伙伴一起共同的支撑千行百业，进入生成式 AI‘第二阶段’。”张鹏称。

据悉，智谱 AI 成立于2019年，脱胎于清华大学计算机系知识工程研究室团队，是清华大学知识成果转化的创业公司，瞄准 AI 大模型研发落地，公司CEO张鹏毕业于清华计算机系，总裁王绍兰为清华创新领军博士，清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。

在2020年，智谱AI开启了对GLM预训练架构的探索与研发，并成功训练出了拥有100亿参数的GLM-10B模型；进入2021年，通过运用MoE架构，智谱AI成功地训练出了万亿稀疏模型；而在2022年，智谱AI进一步公布了一款具备1300亿级参数的超大规模预训练通用模型GLM-130B，基于此，智谱AI构建了大模型平台以及丰富的产品矩阵。

在2023年，我国的人工智能领军企业智谱AI推出了一款具有千亿参数规模的基础座对话模型ChatGLM，并且还公开了单卡版模型ChatGLM-6B。这些先进技术已经得到了广泛的应用，覆盖了个人开发者和企业应用领域。紧接着在今年的6月份，智谱AI再次升级了ChatGLM模型系列，其中包括了6B、130B、12B（120亿参数）、32B、66B等不同规模的模型，其推理速度相较于上一代产品提升了42%。据智谱AI的相关负责人张鹏透露，ChatGLM2-12B、32B和66B模型的性能，相较于GPT-4版本的ChatGPT有了显著的提升。具体来说，ChatGLM2-12B模型的性能提升了16%，ChatGLM2-32B模型的性能提升了36%，而ChatGLM2-66B模型的性能更是达到了280%的增长。这些数据充分展示了智谱AI在人工智能领域的技术实力和创新能力。

目前，智谱 AI 的开源模型在全球范围内已经获得了超过1000次的下载。除此之外，该公司也在积极尝试商业化的发展，致力于开发和生产 AIGC（生成式AI）模型和相关产品系列。其中，智谱清言和高效率代码模型 CodeGeeX 已经成功获得批准并投入使用。

融资方面，创立至今的四年多，智谱AI 共完成四轮融资。10月20日，智谱 AI 宣布年内累计融资额超过25亿元人民币，投资方包括社保基金中关村自主创新基金（君联资本为基金管理人）、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构，而君联资本等部分老股东跟投，华兴资本担任独家财务顾问。

截至目前，智谱 AI 公司估值已超过100亿元，是国内 AI 领域独角兽企业。公司称，上述融资将用于基座大模型的进一步研发，更好地支撑行业生态。

此次，智谱 AI 发布的最新ChatGLM3通用基座大模型，在性能、推理、算力、Agent智能体能力、API商业化等方面均有提升。

在性能层面上，ChatGLM3-6B在中英双语的44个公开数据集测试中，展示出了我国同等规模模型的优势，位居首位。相较于ChatGLM2-6B，它在多个排名中提升了33%以上，GSM8K基准更是取得了179%的提升。而在推理效率上，ChatGLM3-6B的表现同样卓越，其与当前由伯克利大学开源的vLLM相比，速度快了2-3倍，同时推理成本也降低了一半。

新模型采用了自研的AgentTuning技术，有效提升了模型的智能体能力，使其在智能规划和执行方面超越了ChatGLM2。该模型能够支持多种复杂的场景，包括工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理以及操作系统等，表现出了极高的适应性。据最新的AgentBench基准测试显示，ChatGLM3-turbo和GPT-3.5在某些方面的表现已经非常接近。而在我国自身的算力平台上，例如昇腾生态，ChatGLM3推理速度更是提升了3倍，展现出了强大的性能优势。

在模型尺寸方面，ChatGLM系列首次引入了1.5B、3B等小型参数模型，这是为了在满足用户需求和降低算力成本之间达到平衡。其中，ChatGLM3-1.5B这款边缘侧模型可以支持国产芯片，并且可以在笔记本电脑、手机、汽车等不同场景中进行部署。它的速度可以达到每秒20个令牌，同时在精度上，1.5B和3B模型的表现与ChatGLM2-6B模型相差无几。

现场演示中，对标ChatGPT、基于ChatGLM3的 AI 聊天机器人平台“智谱清言”，如今不仅可以实现表格生成柱状图、折线图，而且还可以获得实时新闻搜索数据、看蔬菜写菜谱以及代码生成函数等能力。

然而，钛媒体App也发现，在比如“用代码画心形”这类问题上，智谱清言仍存在一定的输出错误等幻觉问题。

另外，在To B企业端方面，智谱AI 提供的 API 开放平台支持开放模型、专属模型、本地化私有模型部署方案，帮助企业去构建自主可控大模型。同时，ChatGLM3 开发平台从三种量级整合为ChatGLM3-turbo，只提供一个标准 API模型方案，整体价格降低50%。

“这（ChatGLM3模型价格）达到国内最低，甚至在全世界范围之内大模型 API 售价最低的水平线。”张鹏表示。

据钛媒体App了解，目前智谱 AI 公司主要销售三类技术产品：数字人SaaS/PaaS方案，科技情报SaaS/PaaS方案，以及包括ChatGLM系列在内的认知大模型PaaS/MaaS平台方案。

张鹏透露，目前智谱 AI GLM大模型已经应用于政务、金融、能源、制造、医疗等领域，支持华为昇腾、神威超算、海光DCU等10余种国产硬件生态，合作伙伴包括阿里、腾讯云、火山引擎、华为、美团、微软、OPPO、海天瑞声等数十家公司。

（本文首发钛媒体App，作者｜林志佳）

举报/反馈

自然语言处理, 人工智能模型, 智谱AI, ChatGLM3

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复