国内首个自家长模大型科技企业！阿里云通义千问70亿参数开源模型发布在近日结束的“百模大战”中，我国大型科技企业阿里云成功推出了自家的大模型——通义千问，并且

文章主题：作者, 周愚, 编辑, 邓咏仪

作者 | 周愚

编辑 | 邓咏仪

在这场国内大模型的 ” 百模大战 ” 中，开源生态正在日趋活跃。

在8月3日，我国知名的AI模型社区魔搭ModelScope正式发布了两款全新的开源模型——Qwen-7B和Qwen-7B-Chat。阿里云已经确认这两款模型分别是通义千问70亿参数通用模型和对话模型，并且这两款模型目前已经对外公开，可以免费使用，同时也可以进行商业化的应用。这一消息引起了广泛的关注，展示了我国AI技术的发展和进步。

至此，阿里云称已经成为国内首个开源自家大模型的大型科技企业。

来源：阿里云

在参数方面，Qwen-7B基座模型能够兼容中英文等多语种，经过在超过2万亿token的数据集中进行训练，其上下文窗口长度可达8k。此外，该模型的开源代码允许用户对Qwen-7B以及Qwen-7B-Chat进行量化，使得用户能够在消费级显卡上进行模型的部署和运行。

用户有两个途径可以获取和使用魔搭社区提供的模型：其一，可以直接从魔搭社区下载；其二，是通过阿里云的灵积平台，访问并调用Qwen-7B以及Qwen-7B-Chat。阿里云提供一站式服务，涵盖了模型训练、推理、部署和精调等环节。

开源作为一种有效途径，旨在追逐已有的闭源模型。然而，近期在海外市场，Meta公司推出的Llama 2在上个月实现了开源，且允许免费使用，这使得它在发布后立刻被视为最强大的开源大型语言模型。

在我国，一些重要的AI模型，如百川智能的Baichuan-7B和清华大学与智谱AI共同发布的ChatGLM2-6B，正在逐渐崭露头角，成为国内AI初创企业的一大竞争力量。这些开源的行动，无疑对大型企业产生了深远的影响。在此之前，我国的许多大型企业倾向于保持封闭，不愿意开源。然而，随着阿里巴巴通义千问的开源，我们可以看到大型企业对于开源模型的接受度正在发生改变，这无疑预示着大型模型思路的一次重大转变。

其实，阿里云的开源战略早有端倪，为通义千问的开源做出了铺垫。

上架通义千问开源模型的魔搭 ModelScope,是由阿里云于去年11月初牵头发起的AI模型社区。至今,该平台已经汇集了来自20多家人工智能机构所贡献的超过1000个开源模型,吸引了超过160万开发者参与,并且模型下载量已经突破了2500万次。

在今年 6 月举行的 2023 开放原子全球开源峰会上，阿里云还公布了 “1+4” 开源战略。除魔搭社区外，阿里云还将聚焦操作系统、云原生、数据库、大数据等四大开源领域。

开源的同时，阿里云也公布了通义千问 7B 预训练模型在多个权威基准测评中的表现。

在英文能力测评基准 MMLU 上，通义千问 7B 模型得分超过一众 7B、12B、13B 主流开源模型。在中文常识能力测评基准 C-Eval 上，通义千问在验证集和测试集中也都是得分最高的 7B 开源模型。

在数学解题能力评测 GSM8K、代码能力评测 HumanEval 上分别得分 51.6、24.4，超过所有同等尺寸和部分大尺寸开源模型。来源：阿里云

附开源地址：

魔搭 Model Scope：

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face：https://huggingface.co/Qwen

GitHub：https://github.com/QwenLM/Qwen-7B

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复