文章主题:智谱AI, 第三代基座大模型, ChatGLM3, 国产芯片
原标题:适配更多国产芯片 智谱AI推出第三代基座大模型ChatGLM3
在2023年10月27日,我国知名的人工智能公司智谱AI,在中国计算机大会上展示了其最新的研究成果。该公司的第三代基座大模型ChatGLM3以及相关系列产品一同亮相,这标志着智谱AI在人工智能领域取得了重大突破,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后,再次展现了其在人工智能领域的强大实力。
本次发布的ChatGLM3具备独特 multi-stage enhanced pre-training method,从而让训练更加深入。经过评测,ChatGLM3 在44个中英文公开数据集中表现优异,成为国内同尺寸模型中的佼佼者。在发布会现场,智谱AI 的CEO 张鹏展示了新产品的功能,并实时进行了操作演示。
ChatGLM3全新技术升级 更高性能更低成本
智谱AI凭借更为丰富的训练数据和卓越的训练策略,成功地将ChatGLM3的性能提升至一个新的高度。相较于ChatGLM2,MMLU的性能提高了36%,CEval的提升幅度达到了33%,GSM8K的表现更是取得了179%的涨幅,而BBH则实现了126%的增长。这些显著的改进充分展示了ChatGLM3在各项性能指标上的优秀表现,彰显了智谱AI在人工智能领域的技术实力和领先地位。
ChatGLM3针对GPT-4V进行了多项创新功能的技术升级,其中包括多模态理解能力的CogVLM-看图识语义。这一功能在国际标准的10余个图文评测数据集上表现出了卓越的性能,成为了该领域的领先者。此外,Code Interpreter代码增强模块能够根据用户的需求自动生成并执行代码,从而轻松完成数据分析、文件处理等复杂任务。而网络搜索增强WebGLM-接入搜索增强则能让ChatGLM3在回答问题时,自动地在互联网上查找相关资料,并在答案中提供相关的文献或文章链接。这些技术的更新使得ChatGLM3的语义能力和逻辑能力有了显著的提升。
ChatGLM3 是我国自主研发的人工智能助手,其独特的设计使其具备了强大的智能体能力。尤其是在智能规划和执行方面,相较于之前的ChatGLM2,它的表现有了显著的提升,达到了1000%的增长。此外,ChatGLM3还积极拓展了其在各个领域的应用,包括国产大模型的原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理以及操作系统等复杂场景,进一步展示了其全面而强大的能力。
除此外,ChatGLM3此次推出了两种适用于手机端部署的端测模型——ChatGLM3-1.5B和ChatGLM3-3B。这两种模型均得到了vivo、小米、三星等多款手机的支持,并且还可以在车载平台上运行。更值得一提的是,它们还能够支持移动设备上的CPU芯片进行推理,其速度高达20 tokens/s。在精度方面,ChatGLM3-1.5B和ChatGLM3-3B模型的表现与ChatGLM2-6B模型相当,证明了其在性能上的优越性。
基于我国最新研发的高效动态推理与显存优化技术,ChatGLM3的推理框架在相同的硬件和模型条件下,其性能表现已经超越了目前最为优秀的开源实现,如伯克利大学的vLLM以及Hugging Face TGI的最新版本。具体来说,ChatGLM3的推理速度要比这些开源实现快上2-3倍,而推理成本则降低了一半。更为重要的是,每千 tokens 的成本仅为0.5分,这在所有对比方案中都是最低的。因此,无论是从性能还是成本的角度来看,ChatGLM3都已经成为了当下最优秀的推理框架。
免责声明:
在本文中,我们将要强调的是,本公众号并未对所发布信息的可用性、准确性、时效性、有效性以及完整性做出任何形式的承诺或保障。同时,我们也要明确指出,对于因信息发布所产生的任何潜在责任或相关后果,本公众号将不会承担任何责任。
2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。
3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。
责任编辑:
智谱AI, 第三代基座大模型, ChatGLM3, 国产芯片