通义千问：开源大模型的崛起，对中国AI生态意味着什么？

文章主题：通义千问, 开源, 模型, 人工智能

分享一个好消息——通义千问，开源了！

昨天，通义千问70亿参数通用模型Qwen-7B和对话模型Qwen-7B-Chat上架魔搭，两款模型均开源、免费、可商用。

今年四月，阿里云推出自研大模型通义千问，引发了大量市场需求。最近，该公司的最小型模型版本已开源，这将有助于降低模型使用的门槛，使更多的中小企业和AI开发者能够尽早、更快地应用通义千问。

Qwen-7B是支持中、英等多种语言的基座模型，在超过2万亿token数据集上训练，上下文窗口长度达到8k。

Qwen-7B-Chat是基于基座模型的中英文对话模型，已实现与人类认知对齐。

作为一位文章写作高手，我将重新组织原文内容，并保持其专业性和表达水平。在此过程中，我将确保不使用原文中的作者和联系方式信息，同时保持文章的字数不少于原文。在本文中，我们将探讨如何利用开源代码来支持对 Qwen-7B 和 Qwen-7B-Chat 的量化分析。这使得用户能够在消费级显卡上部署和运行这些模型。首先，用户可以在魔搭社区中下载相应的模型，然后将其本地部署。其次，用户还可以在魔搭平台上轻松地启动阿里云机器学习平台 PAI，从而在云端对模型进行微调、部署和推理。通过这种方式，用户可以充分利用开源代码的优势，提高模型性能，同时节省时间和成本。

若开发者在开启产品时希望立即运用Qwen-7b和Qwen-7b-chat，可以通过阿里云模型API平台——灵积来进行测试调用通义千问API。作为我国领先的云计算服务提供商，阿里云提供一站式解决方案，涵盖模型下载、训练、部署和推理等全方位服务。

通义千问7B预训练模型在各种权威基准测试中展现了卓越的表现，其中文和英文能力不仅超过了国内外的同类开源模型，而且在某些方面甚至超越了更大规模的开源模型。其中，该模型的部分能力更是达到了”跃级”的境界，成功赶超了一些12B、13B规模的开源模型。

在英语能力测评基准MMLU中，通义千问7B模型表现卓越，其得分超过了众多7B、12B、13B主流开源模型。该基准涵盖了57个学科的英文题目，旨在考查人文、社科、理工等领域的综合知识和问题解决能力。

在C-Eval中文常识能力测评基准中，通义千问模型在验证集和测试集中均取得了最高的7B分数，充分展示了其扎实的中文处理能力。相较于英文世界的繁荣AI开源生态，我国中文社区尚缺乏优秀的基座模型。通义千问模型的出现，有望为开源社区带来更多选择，进而推动我国AI开源生态的建设与发展。

在数学解题能力评测GSM8K、代码能力评测HumanEval等基准上，通义千问7B模型也有不俗表现，胜过所有同等尺寸开源模型和和部分大尺寸开源模型。

开源大模型可以帮助用户简化模型训练和部署的过程，用户不必从头训练模型，只需下载预训练好的模型并进行微调，就可快速构建高质量的模型。

开源生态对促进中国大模型的技术进步与应用落地至关重要。今年7月，阿里云宣布将促进中国大模型生态的繁荣作为首要目标，向大模型创业公司提供智能算力、开发工具等全方位服务。2022年阿里云牵头发起AI模型社区魔搭，以AI模型为核心服务AI开发者。目前，魔搭聚集了20多家顶尖人工智能机构贡献的1000多款开源模型。

*开源地址：

魔搭ModelScope：

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face：https://huggingface.co/Qwen

GitHub：https://github.com/QwenLM/Qwen-7B

/ END /

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复