文章主题:阿里云, 通义千问, 开源模型, 大厂
阿里云发布通义千问开源模型,打响大厂开源第一枪 | 最前线
作者 | 周愚
编辑 | 邓咏仪
在这场国内大模型的“百模大战”中,开源生态正在日趋活跃。
在8月3日这个美好的日子里,我们的AI模型社区魔搭ModelScope迎来了一位新的成员——Qwen-7B和Qwen-7B-Chat。阿里云官方已经确认这两款模型是通义千问70亿参数通用模型和对话模型,而且它们现在已经正式开源,对外免费开放,可以被广大商业用户所采用。这两款模型的上线,无疑为我们的人工智能领域增添了最新的技术成果,也进一步推动了我国人工智能技术的进步和发展。让我们一起期待这些模型在未来能够带来更多的惊喜吧!🚀
至此,阿里云称已经成为国内首个开源自家大模型的大型科技企业。
来源:阿里云
Qwen-7B基座模型是一款强大的自然语言处理工具,其对中英文等多语言的支持,使其能够应对各种语言环境下的挑战。该模型的训练是基于超过2万亿个token数据集进行的,其上下文窗口长度更是达到了惊人的8k。对于那些热衷于开源技术的用户来说,Qwen-7B基座模型的开源代码为其提供了便利,使得他们能够在消费级显卡上轻松部署和运行模型。总的来说,Qwen-7B基座模型以其卓越的性能和功能,成为了自然语言处理领域的佼佼者。
使用魔搭社区或阿里云灵积平台,用户均可以轻松获取Qwen-7B和Qwen-7B-Chat模型。同时,阿里云提供一站式服务,涵盖了模型训练、推理、部署以及精调等全方位流程。
开源是一种有效的方式,可以让我们追赶上现有的闭源模型。就在这个月,Meta公司旗下的Llama 2的开源版本发布,而且它既可以免费使用,也可以用于商业目的。自从推出以来,Llama 2都被誉为是最强大的开源大模型。
在我国,百川智能推出的Baichuan-7B以及清华大学与智谱AI联合发布的ChatGLM2-6B等大型开源模型,正逐渐成为AI领域中不可忽视的势力。这些开放源代码的行动,无疑对大型企业产生了深远的影响——过去,我国的许多大型企业倾向于保持闭源。然而,如今,阿里巴巴的通义千问也开始开源,这无疑标志着大型企业对于大模型开发策略的一次重大转变。
其实,阿里云的开源战略早有端倪,为通义千问的开源做出了铺垫。
上架通义千问开源模型的魔搭ModelScope,是由阿里云于去年11月初倡导并推出的AI模型社区。当前,魔搭已经汇集了来自20多家人工智能机构的超过1000款开源模型,吸引了超过160万的开发者参与,并且模型下载量已经突破了2500万。
在今年6月举行的2023开放原子全球开源峰会上,阿里云还公布了“1+4”开源战略。除魔搭社区外,阿里云还将聚焦操作系统、云原生、数据库、大数据等四大开源领域。
开源的同时,阿里云也公布了通义千问7B预训练模型在多个权威基准测评中的表现。
在英文能力测评基准MMLU上,通义千问7B模型得分超过一众7B、12B、13B主流开源模型。在中文常识能力测评基准C-Eval上,通义千问在验证集和测试集中也都是得分最高的7B开源模型。
在数学解题能力评测GSM8K、代码能力评测HumanEval上分别得分51.6、24.4,超过所有同等尺寸和部分大尺寸开源模型。来源:阿里云
附开源地址:
魔搭Model Scope:
https://modelscope.cn/models/qwen/Qwen-7B/summary
https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary
Hugging Face:https://huggingface.co/Qwen
GitHub:https://github.com/QwenLM/Qwen-7B返回搜狐,查看更多
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!