阿里云通义千问70亿参数开源模型：是时候和大厂抢跑了吗？

文章主题：阿里云, 通义千问, 开源模型, 大厂

阿里云发布通义千问开源模型，打响大厂开源第一枪 | 最前线

作者 | 周愚

编辑 | 邓咏仪

在这场国内大模型的“百模大战”中，开源生态正在日趋活跃。

在8月3日这个美好的日子里，我们的AI模型社区魔搭ModelScope迎来了一位新的成员——Qwen-7B和Qwen-7B-Chat。阿里云官方已经确认这两款模型是通义千问70亿参数通用模型和对话模型，而且它们现在已经正式开源，对外免费开放，可以被广大商业用户所采用。这两款模型的上线，无疑为我们的人工智能领域增添了最新的技术成果，也进一步推动了我国人工智能技术的进步和发展。让我们一起期待这些模型在未来能够带来更多的惊喜吧！🚀

至此，阿里云称已经成为国内首个开源自家大模型的大型科技企业。

来源：阿里云

Qwen-7B基座模型是一款强大的自然语言处理工具，其对中英文等多语言的支持，使其能够应对各种语言环境下的挑战。该模型的训练是基于超过2万亿个token数据集进行的，其上下文窗口长度更是达到了惊人的8k。对于那些热衷于开源技术的用户来说，Qwen-7B基座模型的开源代码为其提供了便利，使得他们能够在消费级显卡上轻松部署和运行模型。总的来说，Qwen-7B基座模型以其卓越的性能和功能，成为了自然语言处理领域的佼佼者。

使用魔搭社区或阿里云灵积平台，用户均可以轻松获取Qwen-7B和Qwen-7B-Chat模型。同时，阿里云提供一站式服务，涵盖了模型训练、推理、部署以及精调等全方位流程。

开源是一种有效的方式，可以让我们追赶上现有的闭源模型。就在这个月，Meta公司旗下的Llama 2的开源版本发布，而且它既可以免费使用，也可以用于商业目的。自从推出以来，Llama 2都被誉为是最强大的开源大模型。

在我国，百川智能推出的Baichuan-7B以及清华大学与智谱AI联合发布的ChatGLM2-6B等大型开源模型，正逐渐成为AI领域中不可忽视的势力。这些开放源代码的行动，无疑对大型企业产生了深远的影响——过去，我国的许多大型企业倾向于保持闭源。然而，如今，阿里巴巴的通义千问也开始开源，这无疑标志着大型企业对于大模型开发策略的一次重大转变。

其实，阿里云的开源战略早有端倪，为通义千问的开源做出了铺垫。

上架通义千问开源模型的魔搭ModelScope，是由阿里云于去年11月初倡导并推出的AI模型社区。当前，魔搭已经汇集了来自20多家人工智能机构的超过1000款开源模型，吸引了超过160万的开发者参与，并且模型下载量已经突破了2500万。

在今年6月举行的2023开放原子全球开源峰会上，阿里云还公布了“1+4”开源战略。除魔搭社区外，阿里云还将聚焦操作系统、云原生、数据库、大数据等四大开源领域。

开源的同时，阿里云也公布了通义千问7B预训练模型在多个权威基准测评中的表现。

在英文能力测评基准MMLU上，通义千问7B模型得分超过一众7B、12B、13B主流开源模型。在中文常识能力测评基准C-Eval上，通义千问在验证集和测试集中也都是得分最高的7B开源模型。

在数学解题能力评测GSM8K、代码能力评测HumanEval上分别得分51.6、24.4，超过所有同等尺寸和部分大尺寸开源模型。来源：阿里云

附开源地址：

魔搭Model Scope：

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face：https://huggingface.co/Qwen

GitHub：https://github.com/QwenLM/Qwen-7B返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复