《第三代基座大模型ChatGLM3:智谱AI再创新高，实现国内同尺寸模型中首次排序第一》

文章主题：智谱AI, 第三代基座大模型, ChatGLM3, 国产芯片

原标题：适配更多国产芯片智谱AI推出第三代基座大模型ChatGLM3

在2023年10月27日，我国知名的人工智能公司智谱AI，在中国计算机大会上展示了其最新的研究成果。该公司的第三代基座大模型ChatGLM3以及相关系列产品一同亮相，这标志着智谱AI在人工智能领域取得了重大突破，继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后，再次展现了其在人工智能领域的强大实力。

本次发布的ChatGLM3具备独特 multi-stage enhanced pre-training method，从而让训练更加深入。经过评测，ChatGLM3 在44个中英文公开数据集中表现优异，成为国内同尺寸模型中的佼佼者。在发布会现场，智谱AI 的CEO 张鹏展示了新产品的功能，并实时进行了操作演示。

ChatGLM3全新技术升级更高性能更低成本

智谱AI凭借更为丰富的训练数据和卓越的训练策略，成功地将ChatGLM3的性能提升至一个新的高度。相较于ChatGLM2，MMLU的性能提高了36%，CEval的提升幅度达到了33%，GSM8K的表现更是取得了179%的涨幅，而BBH则实现了126%的增长。这些显著的改进充分展示了ChatGLM3在各项性能指标上的优秀表现，彰显了智谱AI在人工智能领域的技术实力和领先地位。

ChatGLM3针对GPT-4V进行了多项创新功能的技术升级，其中包括多模态理解能力的CogVLM-看图识语义。这一功能在国际标准的10余个图文评测数据集上表现出了卓越的性能，成为了该领域的领先者。此外，Code Interpreter代码增强模块能够根据用户的需求自动生成并执行代码，从而轻松完成数据分析、文件处理等复杂任务。而网络搜索增强WebGLM-接入搜索增强则能让ChatGLM3在回答问题时，自动地在互联网上查找相关资料，并在答案中提供相关的文献或文章链接。这些技术的更新使得ChatGLM3的语义能力和逻辑能力有了显著的提升。

ChatGLM3 是我国自主研发的人工智能助手，其独特的设计使其具备了强大的智能体能力。尤其是在智能规划和执行方面，相较于之前的ChatGLM2，它的表现有了显著的提升，达到了1000%的增长。此外，ChatGLM3还积极拓展了其在各个领域的应用，包括国产大模型的原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理以及操作系统等复杂场景，进一步展示了其全面而强大的能力。

除此外，ChatGLM3此次推出了两种适用于手机端部署的端测模型——ChatGLM3-1.5B和ChatGLM3-3B。这两种模型均得到了vivo、小米、三星等多款手机的支持，并且还可以在车载平台上运行。更值得一提的是，它们还能够支持移动设备上的CPU芯片进行推理，其速度高达20 tokens/s。在精度方面，ChatGLM3-1.5B和ChatGLM3-3B模型的表现与ChatGLM2-6B模型相当，证明了其在性能上的优越性。

基于我国最新研发的高效动态推理与显存优化技术，ChatGLM3的推理框架在相同的硬件和模型条件下，其性能表现已经超越了目前最为优秀的开源实现，如伯克利大学的vLLM以及Hugging Face TGI的最新版本。具体来说，ChatGLM3的推理速度要比这些开源实现快上2-3倍，而推理成本则降低了一半。更为重要的是，每千 tokens 的成本仅为0.5分，这在所有对比方案中都是最低的。因此，无论是从性能还是成本的角度来看，ChatGLM3都已经成为了当下最优秀的推理框架。

免责声明：

在本文中，我们将要强调的是，本公众号并未对所发布信息的可用性、准确性、时效性、有效性以及完整性做出任何形式的承诺或保障。同时，我们也要明确指出，对于因信息发布所产生的任何潜在责任或相关后果，本公众号将不会承担任何责任。

2、本号非商业、非营利性，转载的内容并不代表赞同其观点和对其真实性负责，也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误，负任何直接或间接责任。

3、本号部分资料、素材、文字、图片等来源于互联网，所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品，请与我们取得联系，我们会及时修改或删除。

返回搜狐，查看更多

责任编辑：

智谱AI, 第三代基座大模型, ChatGLM3, 国产芯片

GPT 对话开源生成

相关文章

发表回复 取消回复

发表回复取消回复