《智谱ChatGLM3：颠覆性的AI大模型，引领智能科技革命》

文章主题：AI大模型, 智谱ChatGLM3, 多阶段增强预训练, 智能科技革命

原标题：智谱ChatGLM3震撼发布：超越想象的AI大模型，引领智能科技革命！

在2023年的中国计算机大会（CNCC）上，智谱AI公司推出了一款名为ChatGLM3的全新基座大模型及其相关产品。该模型运用了创新的多阶段增强预训练技术，以期在训练过程中取得更为显著的效果。

智谱AI的首席执行官张鹏先生亲自主持了新品的发布会，并借助实时展示的方式向公众展示了产品的新特性。据公司介绍，ChatGLM3通过利用更加丰富且优化的训练数据以及先进的训练策略，实现了性能的大幅提升。相较于上一代的ChatGLM2，其在MMLU、CEval、GSM8K、BBH等方面的表现均有显著进步，分别提升了36%、33%、179%和126%。

除上述功能外，ChatGLM3还对GPT-4V进行了深度优化。其新引入的多模态理解能力，让CogVLM具备了看图识语义的功能，这一技术在国际标准的图文评测数据集中表现出了卓越的性能。同时，Code Interpreter模块的加入，使得用户可以根据自身需求生成并执行代码，轻松完成数据分析、文件处理等复杂任务。而网络搜索增强模块WebGLM-接入搜索增强，更是让ChatGLM3有了搜索互联网的能力，能在回答问题时，自动寻找并引用相关资料或文章链接。这些功能的引入，使得ChatGLM3的语义能力和逻辑能力有了显著提升。

除了上述功能外，ChatGLM3还整合了自身研发的AgentTuning技术，进一步提升了模型的智能代理性能。尤其是在智能规划和执行方面，相较于ChatGLM2提高了1000%。同时，ChatGLM3还提供了对国产大型模型的原生支持，覆盖了工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理以及操作系统等多个复杂场景。

ChatGLM3不仅在功能上表现出色，更是在便携性上提供了突破性的技术升级。其可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B，兼容多款手机品牌，如vivo、小米、三星等，更支持移动平台上CPU芯片的推理，速度高达20 tokens/s。在精度上，ChatGLM3-1.5B和ChatGLM3-3B模型在公开benchmark上的性能与ChatGLM2-6B模型相当，展现了卓越的性能表现。

ChatGLM3的推理框架利用了最新的高效动态推理和显存优化技术,相较于其他开源实现如伯克利大学的vLLM和Hugging Face TGI的最新版本,在相同的硬件和模型条件下,推理速度提高了2-3倍,推理成本降低了一半。每千tokens的成本仅为0.5分,这使得ChatGLM3成为了当前最具竞争力和高效性能的大模型之一。

智谱AI的新一代ChatGLM3基座大模型以其强大的性能和丰富的功能，将为用户提供更加高效、智能的交互体验，并在各个领域展现出巨大的潜力。返回搜狐，查看更多

责任编辑：

AI大模型, 智谱ChatGLM3, 多阶段增强预训练, 智能科技革命

GPT 开源生成

相关文章

发表回复 取消回复

发表回复取消回复