文章主题:ChatGLM2-6B, 性能, 提升, MMLU
品玩 6 月 26 日讯,据 huggingface 页面显示, ChatGLM-6B 的第二代版本 ChatGLM2-6B 现已正式开源。
ChatGLM2-6B 在性能上超越了 ChatGLM-6B,展示了更出色的能力。相较于初代模型,它在多个数据集上都有显著的提升,如 MMLU(23%)、CEval(33%)、GSM8K(571%)以及 BBH(60%)。这使得 ChatGLM2-6B 在同尺寸的开源模型中具有很强的竞争力。同时,ChatGLM2-6B 的基座模型在上下文长度上也有所改进,从 ChatGLM-6B 的 2K 扩展到 32K,并且在对话阶段使用了 8K 的上下文长度进行训练,从而允许进行了更多的对话轮次。
ChatGLM2-6B 的出现,使得推理过程更加高效成为可能。在官方的模型实现中,它的推理速度相较于初代模型有了显著的提升,达到了42%。同时,INT4量化技术的应用也进一步提高了6G显存的支持对话长度,从1K提升至了8K。这无疑是对人工智能技术的一次重大突破,也是我国在人工智能领域取得的一项重要成就。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!