文章主题:AI大模型, 智谱ChatGLM3, 多阶段增强预训练, 智能科技革命

666AI工具大全,助力做AI时代先行者!

原标题:智谱ChatGLM3震撼发布:超越想象的AI大模型,引领智能科技革命!

在2023年的中国计算机大会(CNCC)上,智谱AI公司推出了一款名为ChatGLM3的全新基座大模型及其相关产品。该模型运用了创新的多阶段增强预训练技术,以期在训练过程中取得更为显著的效果。

智谱AI的首席执行官张鹏先生亲自主持了新品的发布会,并借助实时展示的方式向公众展示了产品的新特性。据公司介绍,ChatGLM3通过利用更加丰富且优化的训练数据以及先进的训练策略,实现了性能的大幅提升。相较于上一代的ChatGLM2,其在MMLU、CEval、GSM8K、BBH等方面的表现均有显著进步,分别提升了36%、33%、179%和126%。

a466e214e86d40a9b5f5f618cd88817b.jpeg

除上述功能外,ChatGLM3还对GPT-4V进行了深度优化。其新引入的多模态理解能力,让CogVLM具备了看图识语义的功能,这一技术在国际标准的图文评测数据集中表现出了卓越的性能。同时,Code Interpreter模块的加入,使得用户可以根据自身需求生成并执行代码,轻松完成数据分析、文件处理等复杂任务。而网络搜索增强模块WebGLM-接入搜索增强,更是让ChatGLM3有了搜索互联网的能力,能在回答问题时,自动寻找并引用相关资料或文章链接。这些功能的引入,使得ChatGLM3的语义能力和逻辑能力有了显著提升。

b2aeb18b06a245a7a9aa71eb55d217e6.png

除了上述功能外,ChatGLM3还整合了自身研发的AgentTuning技术,进一步提升了模型的智能代理性能。尤其是在智能规划和执行方面,相较于ChatGLM2提高了1000%。同时,ChatGLM3还提供了对国产大型模型的原生支持,覆盖了工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理以及操作系统等多个复杂场景。

ChatGLM3不仅在功能上表现出色,更是在便携性上提供了突破性的技术升级。其可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,兼容多款手机品牌,如vivo、小米、三星等,更支持移动平台上CPU芯片的推理,速度高达20 tokens/s。在精度上,ChatGLM3-1.5B和ChatGLM3-3B模型在公开benchmark上的性能与ChatGLM2-6B模型相当,展现了卓越的性能表现。

0a68aab70f3f45239deac292c15f2307.jpeg

ChatGLM3的推理框架利用了最新的高效动态推理和显存优化技术,相较于其他开源实现如伯克利大学的vLLM和Hugging Face TGI的最新版本,在相同的硬件和模型条件下,推理速度提高了2-3倍,推理成本降低了一半。每千tokens的成本仅为0.5分,这使得ChatGLM3成为了当前最具竞争力和高效性能的大模型之一。

智谱AI的新一代ChatGLM3基座大模型以其强大的性能和丰富的功能,将为用户提供更加高效、智能的交互体验,并在各个领域展现出巨大的潜力。返回搜狐,查看更多

责任编辑:

AI大模型, 智谱ChatGLM3, 多阶段增强预训练, 智能科技革命

Leave a Reply

Your email address will not be published. Required fields are marked *