文章主题:阿里云, 通义千问, 开源模型, 大厂

666AI工具大全,助力做AI时代先行者!

阿里云发布通义千问开源模型,打响大厂开源第一枪 | 最前线

作者 | 周愚

编辑 | 邓咏仪

在这场国内大模型的“百模大战”中,开源生态正在日趋活跃。

在8月3日这个美好的日子里,我们的AI模型社区魔搭ModelScope迎来了一位新的成员——Qwen-7B和Qwen-7B-Chat。阿里云官方已经确认这两款模型是通义千问70亿参数通用模型和对话模型,而且它们现在已经正式开源,对外免费开放,可以被广大商业用户所采用。这两款模型的上线,无疑为我们的人工智能领域增添了最新的技术成果,也进一步推动了我国人工智能技术的进步和发展。让我们一起期待这些模型在未来能够带来更多的惊喜吧!🚀

至此,阿里云称已经成为国内首个开源自家大模型的大型科技企业。

来源:阿里云

Qwen-7B基座模型是一款强大的自然语言处理工具,其对中英文等多语言的支持,使其能够应对各种语言环境下的挑战。该模型的训练是基于超过2万亿个token数据集进行的,其上下文窗口长度更是达到了惊人的8k。对于那些热衷于开源技术的用户来说,Qwen-7B基座模型的开源代码为其提供了便利,使得他们能够在消费级显卡上轻松部署和运行模型。总的来说,Qwen-7B基座模型以其卓越的性能和功能,成为了自然语言处理领域的佼佼者。

使用魔搭社区或阿里云灵积平台,用户均可以轻松获取Qwen-7B和Qwen-7B-Chat模型。同时,阿里云提供一站式服务,涵盖了模型训练、推理、部署以及精调等全方位流程。

开源是一种有效的方式,可以让我们追赶上现有的闭源模型。就在这个月,Meta公司旗下的Llama 2的开源版本发布,而且它既可以免费使用,也可以用于商业目的。自从推出以来,Llama 2都被誉为是最强大的开源大模型。

在我国,百川智能推出的Baichuan-7B以及清华大学与智谱AI联合发布的ChatGLM2-6B等大型开源模型,正逐渐成为AI领域中不可忽视的势力。这些开放源代码的行动,无疑对大型企业产生了深远的影响——过去,我国的许多大型企业倾向于保持闭源。然而,如今,阿里巴巴的通义千问也开始开源,这无疑标志着大型企业对于大模型开发策略的一次重大转变。

其实,阿里云的开源战略早有端倪,为通义千问的开源做出了铺垫。

上架通义千问开源模型的魔搭ModelScope,是由阿里云于去年11月初倡导并推出的AI模型社区。当前,魔搭已经汇集了来自20多家人工智能机构的超过1000款开源模型,吸引了超过160万的开发者参与,并且模型下载量已经突破了2500万。

在今年6月举行的2023开放原子全球开源峰会上,阿里云还公布了“1+4”开源战略。除魔搭社区外,阿里云还将聚焦操作系统、云原生、数据库、大数据等四大开源领域。

开源的同时,阿里云也公布了通义千问7B预训练模型在多个权威基准测评中的表现。

在英文能力测评基准MMLU上,通义千问7B模型得分超过一众7B、12B、13B主流开源模型。在中文常识能力测评基准C-Eval上,通义千问在验证集和测试集中也都是得分最高的7B开源模型。

在数学解题能力评测GSM8K、代码能力评测HumanEval上分别得分51.6、24.4,超过所有同等尺寸和部分大尺寸开源模型。来源:阿里云

附开源地址:

魔搭Model Scope:

https://modelscope.cn/models/qwen/Qwen-7B/summary

https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary

Hugging Face:https://huggingface.co/Qwen

GitHub:https://github.com/QwenLM/Qwen-7B返回搜狐,查看更多

责任编辑:

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注