文章主题:开源, 大语言模型, 聊天机器人, 中文优化

666AI工具大全,助力做AI时代先行者!

博而不士的开源大语言模型巡展第三站-ChatGLM

近年来,人工智能语言模型取得了显著的进步,为各行各业提供了有力的支持。然而,现有的语言模型大多仅支持英语,对其他语言的应用相对较少,从而在处理多语言环境时存在局限性。为了克服这一问题,我国清华大学数据挖掘实验室(THUDM)研发了一个具有中英双语功能的对话语言模型——ChatGLM。

ChatGLM 是一款基于GLM-130B巨量基座模型开发的智能对话机器人,具备了问答、多轮对话以及代码生成的能力。现阶段,ChatGLM 主要有两个版本:一个是千亿参数的内部测试版ChatGLM,另一个是62亿参数的开源版ChatGLM-6B。ChatGLM-6B于2023年3月14日正式开源,融合了模型量化技术,使得用户能够在消费级显卡上进行本地部署。在INT4量化级别下,仅需6GB显存即可完成部署。ChatGLM 的技术根基是 GLM-130B,这是一款包含多目标函数的自回归预训练模型,既支持中文也支持英文,同时在多个自然语言处理任务上都表现出了超越其他千亿规模模型的优势。

ChatGLM 的性能表现堪称卓越。通过约 1T 标识符的中英双语训练以及监督微调、反馈自助、人类反馈强化学习等技术的辅助,62 亿参数的 ChatGLM-6B 已经能够生成非常贴近人类偏好的回答。而拥有千亿参数的 ChatGLM 更是进一步强化了其在问答和对话方面的强大能力。例如,ChatGLM 可以依据用户给出的主题和语言生成各种风格和内容的文本,同时也能根据用户提出的代码需求生成相应的代码片段。除此之外,基于 ChatGLM-6B 的变种项目在开源社区作者的助力下,还能处理图像输入,从而实现图像理解和多模态对话。

与其他千亿规模的语言模型相比,ChatGLM 有以下几个特点:

ChatGLM-6B 是一款完全开源的模型,用户可以随意下载和使用,其推理能力也十分出色,可在单张 2080Ti 设备上运行。相较于英文,ChatGLM 在中文问答和对话领域有着更为优秀的表现,同时支持中英双语切换。值得一提的是,ChatGLM-6B 是首个实现 INT4 量化的千亿模型,其 GLM-130B 版本能够支持使用一台 4 卡 3090 或 8卡 2080Ti 服务器进行快速、基本无损的推理。更令人惊喜的是,ChatGLM-6B 甚至能部署在消费级显卡上,展现了强大的灵活性和实用性。

ChatGLM 是一款兼具创新性与实用性的对话语言模型,为中英双语场景提供了高效且智能的解决方案。该模型不仅展现了人工智能语言模型在问答与对话领域的最新技术成果,还为开发者和应用者提供了便利、灵活的平台。ChatGLM 的开源与内测将推动人工智能在各领域的应用与创新。

开源, 大语言模型, 聊天机器人, 中文优化

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注