文章主题:智谱AI, 第三代基座大模型, ChatGLM3, 性能突破

666AI工具大全,助力做AI时代先行者!

智谱AI推出第三代基座大模型ChatGLM3 性能全面突破

在2023年10月27日的中国计算机大会上,智谱AI公司展示了其最新的成果:第三代基座大模型ChatGLM3和相关系列产品。这是智谱AI继推出千亿基座的对话模型ChatGLM和ChatGLM2之后,在模型研发领域取得的重大突破。值得注意的是,ChatGLM3采用了智谱AI独家研发的多阶段增强预训练方法,使得训练过程更为充分。经过评测,ChatGLM3在44个中英文公开数据集的测试中表现优异,成为国内同尺寸模型中的第一名。这一成就充分展示了ChatGLM3的高性能和强大的学习能力。此外,智谱AI的CEO张鹏在活动现场亲自发布了这款新品,并实时展示了ChatGLM3的最新功能,让现场观众对其有了更直观的了解。总的来说,智谱AI在2023中国计算机大会上的表现可圈可点,尤其是其全自研的第三代基座大模型ChatGLM3及相关系列产品,不仅取得了显著的成果,还为我国人工智能领域的发展做出了重要贡献。

38677d628d5f4098b4c5d3a45dc7b302.jpeg

ChatGLM3全新技术升级 更高性能更低成本

智谱AI凭借更为丰富的训练数据和卓越的训练策略,成功地将ChatGLM3的性能提升至一个新的高度。相较于ChatGLM2,MMLU的性能提高了36%,CEval的提升幅度达到了33%,GSM8K的表现更是取得了179%的涨幅,而BBH则实现了126%的增长。这些显著的性能提升,充分展示了ChatGLM3在深度学习领域的强大实力和广阔的发展前景。

近日,我国人工智能领域再传佳音,ChatGLM3成功针对GPT-4V进行了多次全新功能的技术迭代升级。此番升级不仅让ChatGLM3具备了多模态理解能力,更使其在CogVLM-看图识语义方面取得了令人瞩目的成果,成为目前国际上10余个重要图文评测数据集中的SOTA(最先进性能)大奖得主。此外,ChatGLM3还新增了代码增强模块Code Interpreter,该模块能够根据用户的实际需求自动生成并执行代码,从而轻松完成数据分析、文件处理等复杂任务。这一创新使得ChatGLM3在易用性和功能性上实现了显著提升。与此同时,ChatGLM3还加强了网络搜索功能,通过接入搜索增强WebGLM-,实现了自动在互联网上寻找相关资料的能力,并在回答问题时能够提供参考相关文献或文章链接。这无疑极大地增强了ChatGLM3的语义能力和逻辑能力,使其在人工智能领域的应用前景更加广阔。

ChatGLM3 是我国自主研发的人工智能助手,其独特的设计使其具备了强大的智能体能力。尤其是在智能规划和执行方面,相较于之前的ChatGLM2,它的表现有了显著的提升,达到了1000%的增长。此外,ChatGLM3还积极拓展了其在各个领域的应用,包括国产大模型的原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理以及操作系统等复杂场景,进一步展示了其全面而强大的能力。

除此外,ChatGLM3此次发布的最新版本——ChatGLM3-1.5B和ChatGLM3-3B,具有可在手机上部署的能力,适用范围广泛,包括但不限于vivo、小米、三星等品牌的手机,甚至还兼容车载平台。更值得一提的是,该模型还具备在移动设备上运行CPU芯片进行推理的能力,其速度高达20 tokens/s。在精度方面,ChatGLM3-1.5B和ChatGLM3-3B模型的表现与ChatGLM2-6B模型相当,证明了其在业界的领先地位。

基于我国科研团队研发的最新高效动态推理与显存优化技术,ChatGLM3的推理框架在相同的硬件和模型条件下,其性能表现已经超越了目前最为优秀的开源实现,如伯克利大学的vLLM以及Hugging Face TGI的最新版本。具体来说,ChatGLM3的推理速度比这些开源实现快了2-3倍,而推理成本则降低了整整一倍。更为重要的是,每千 tokens 的成本仅为0.5分,这在所有同类产品中都是最低的。因此,无论从性能还是成本的角度来看,ChatGLM3都已经成为了当下最受欢迎的选择。

新一代“智谱清言”上线 国内首推代码交互能力

经过全新升级的ChatGLM3赋能,我国首个拥有代码交互能力的生成式AI助手——智谱清言已经问世。这一突破性的成果标志着我国在人工智能领域又迈出了重要的一步(https://chatglm.cn/main/code)。

a99d94c95c0c46859da7cd7ccfc5885c.png

“代码”功能目前已支持图像处理、数学计算、数据分析等使用场景。以下分别为:

§ 处理数据生成图表

§ 代码绘制图形

§ 上传SQL代码分析

230ba3ff9fa2429abdd00e8b696e9a54.png

7f1d913d089648d882018aa12c26e62a.png

3a403c6443184321b8ad59a30fb3b62c.png

自从 WebGLM 大模型能力的融入,智谱清言具备了强大的搜索功能,能够协助用户快速定位相关的网络资源,如文献或文章链接,从而提供解答。

46c74896986844329ec14d9d5e5c341f.jpeg

e74a235339ca4d75b8e5aea3ea751041.png

此前已发布的CogVLM 模型则提高了智谱清言的中文图文理解能力,取得了接近GPT-4V的图片理解能力,它可以回答各种类型的视觉问题,并且可以完成复杂的目标检测,并打上标签,完成自动数据标注。

自2022年初,智谱AI推出的GLM系列模型已支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。截至目前,智谱AI的产品已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。通过与国产芯片企业的联合创新,性能不断优化,将有助于国产原生大模型与国产芯片早日登上国际舞台。

智谱AI此次推出的ChatGLM3及相关系列产品,全面提升了自身的模型性能,为业界打造了更开放的开源生态,并进一步降低了普通用户使用AIGC产品的门槛。AI正在引领我们进入一个新的时代,大模型必将加速这一时刻的到来。返回搜狐,查看更多

责任编辑:

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *