第三代基座大模型ChatGLM3：智谱AI的新一代AI语言交互革命

文章主题：智谱AI, 第三代基座大模型, ChatGLM3, 性能突破

智谱AI推出第三代基座大模型ChatGLM3 性能全面突破

在2023年10月27日的中国计算机大会上，智谱AI公司展示了其最新的成果：第三代基座大模型ChatGLM3和相关系列产品。这是智谱AI继推出千亿基座的对话模型ChatGLM和ChatGLM2之后，在模型研发领域取得的重大突破。值得注意的是，ChatGLM3采用了智谱AI独家研发的多阶段增强预训练方法，使得训练过程更为充分。经过评测，ChatGLM3在44个中英文公开数据集的测试中表现优异，成为国内同尺寸模型中的第一名。这一成就充分展示了ChatGLM3的高性能和强大的学习能力。此外，智谱AI的CEO张鹏在活动现场亲自发布了这款新品，并实时展示了ChatGLM3的最新功能，让现场观众对其有了更直观的了解。总的来说，智谱AI在2023中国计算机大会上的表现可圈可点，尤其是其全自研的第三代基座大模型ChatGLM3及相关系列产品，不仅取得了显著的成果，还为我国人工智能领域的发展做出了重要贡献。

ChatGLM3全新技术升级更高性能更低成本

智谱AI凭借更为丰富的训练数据和卓越的训练策略，成功地将ChatGLM3的性能提升至一个新的高度。相较于ChatGLM2，MMLU的性能提高了36%，CEval的提升幅度达到了33%，GSM8K的表现更是取得了179%的涨幅，而BBH则实现了126%的增长。这些显著的性能提升，充分展示了ChatGLM3在深度学习领域的强大实力和广阔的发展前景。

近日，我国人工智能领域再传佳音，ChatGLM3成功针对GPT-4V进行了多次全新功能的技术迭代升级。此番升级不仅让ChatGLM3具备了多模态理解能力，更使其在CogVLM-看图识语义方面取得了令人瞩目的成果，成为目前国际上10余个重要图文评测数据集中的SOTA（最先进性能）大奖得主。此外，ChatGLM3还新增了代码增强模块Code Interpreter，该模块能够根据用户的实际需求自动生成并执行代码，从而轻松完成数据分析、文件处理等复杂任务。这一创新使得ChatGLM3在易用性和功能性上实现了显著提升。与此同时，ChatGLM3还加强了网络搜索功能，通过接入搜索增强WebGLM-，实现了自动在互联网上寻找相关资料的能力，并在回答问题时能够提供参考相关文献或文章链接。这无疑极大地增强了ChatGLM3的语义能力和逻辑能力，使其在人工智能领域的应用前景更加广阔。

ChatGLM3 是我国自主研发的人工智能助手，其独特的设计使其具备了强大的智能体能力。尤其是在智能规划和执行方面，相较于之前的ChatGLM2，它的表现有了显著的提升，达到了1000%的增长。此外，ChatGLM3还积极拓展了其在各个领域的应用，包括国产大模型的原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理以及操作系统等复杂场景，进一步展示了其全面而强大的能力。

除此外，ChatGLM3此次发布的最新版本——ChatGLM3-1.5B和ChatGLM3-3B，具有可在手机上部署的能力，适用范围广泛，包括但不限于vivo、小米、三星等品牌的手机，甚至还兼容车载平台。更值得一提的是，该模型还具备在移动设备上运行CPU芯片进行推理的能力，其速度高达20 tokens/s。在精度方面，ChatGLM3-1.5B和ChatGLM3-3B模型的表现与ChatGLM2-6B模型相当，证明了其在业界的领先地位。

基于我国科研团队研发的最新高效动态推理与显存优化技术，ChatGLM3的推理框架在相同的硬件和模型条件下，其性能表现已经超越了目前最为优秀的开源实现，如伯克利大学的vLLM以及Hugging Face TGI的最新版本。具体来说，ChatGLM3的推理速度比这些开源实现快了2-3倍，而推理成本则降低了整整一倍。更为重要的是，每千 tokens 的成本仅为0.5分，这在所有同类产品中都是最低的。因此，无论从性能还是成本的角度来看，ChatGLM3都已经成为了当下最受欢迎的选择。

新一代“智谱清言”上线国内首推代码交互能力

经过全新升级的ChatGLM3赋能，我国首个拥有代码交互能力的生成式AI助手——智谱清言已经问世。这一突破性的成果标志着我国在人工智能领域又迈出了重要的一步（https://chatglm.cn/main/code）。

“代码”功能目前已支持图像处理、数学计算、数据分析等使用场景。以下分别为：

§ 处理数据生成图表

§ 代码绘制图形

§ 上传SQL代码分析

自从 WebGLM 大模型能力的融入，智谱清言具备了强大的搜索功能，能够协助用户快速定位相关的网络资源，如文献或文章链接，从而提供解答。

此前已发布的CogVLM 模型则提高了智谱清言的中文图文理解能力，取得了接近GPT-4V的图片理解能力,它可以回答各种类型的视觉问题，并且可以完成复杂的目标检测，并打上标签，完成自动数据标注。

自2022年初，智谱AI推出的GLM系列模型已支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。截至目前，智谱AI的产品已支持10余种国产硬件生态，包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。通过与国产芯片企业的联合创新，性能不断优化，将有助于国产原生大模型与国产芯片早日登上国际舞台。

智谱AI此次推出的ChatGLM3及相关系列产品，全面提升了自身的模型性能，为业界打造了更开放的开源生态，并进一步降低了普通用户使用AIGC产品的门槛。AI正在引领我们进入一个新的时代，大模型必将加速这一时刻的到来。返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复