文章主题:通义千问, 开源, 模型, 人工智能
分享一个好消息——通义千问,开源了!
昨天,通义千问70亿参数通用模型Qwen-7B和对话模型Qwen-7B-Chat上架魔搭,两款模型均开源、免费、可商用。
今年四月,阿里云推出自研大模型通义千问,引发了大量市场需求。最近,该公司的最小型模型版本已开源,这将有助于降低模型使用的门槛,使更多的中小企业和AI开发者能够尽早、更快地应用通义千问。
Qwen-7B是支持中、英等多种语言的基座模型,在超过2万亿token数据集上训练,上下文窗口长度达到8k。
Qwen-7B-Chat是基于基座模型的中英文对话模型,已实现与人类认知对齐。
作为一位文章写作高手,我将重新组织原文内容,并保持其专业性和表达水平。在此过程中,我将确保不使用原文中的作者和联系方式信息,同时保持文章的字数不少于原文。在本文中,我们将探讨如何利用开源代码来支持对 Qwen-7B 和 Qwen-7B-Chat 的量化分析。这使得用户能够在消费级显卡上部署和运行这些模型。首先,用户可以在魔搭社区中下载相应的模型,然后将其本地部署。其次,用户还可以在魔搭平台上轻松地启动阿里云机器学习平台 PAI,从而在云端对模型进行微调、部署和推理。通过这种方式,用户可以充分利用开源代码的优势,提高模型性能,同时节省时间和成本。
若开发者在开启产品时希望立即运用Qwen-7b和Qwen-7b-chat,可以通过阿里云模型API平台——灵积来进行测试调用通义千问API。作为我国领先的云计算服务提供商,阿里云提供一站式解决方案,涵盖模型下载、训练、部署和推理等全方位服务。
通义千问7B预训练模型在各种权威基准测试中展现了卓越的表现,其中文和英文能力不仅超过了国内外的同类开源模型,而且在某些方面甚至超越了更大规模的开源模型。其中,该模型的部分能力更是达到了”跃级”的境界,成功赶超了一些12B、13B规模的开源模型。
在英语能力测评基准MMLU中,通义千问7B模型表现卓越,其得分超过了众多7B、12B、13B主流开源模型。该基准涵盖了57个学科的英文题目,旨在考查人文、社科、理工等领域的综合知识和问题解决能力。
在C-Eval中文常识能力测评基准中,通义千问模型在验证集和测试集中均取得了最高的7B分数,充分展示了其扎实的中文处理能力。相较于英文世界的繁荣AI开源生态,我国中文社区尚缺乏优秀的基座模型。通义千问模型的出现,有望为开源社区带来更多选择,进而推动我国AI开源生态的建设与发展。
在数学解题能力评测GSM8K、代码能力评测HumanEval等基准上,通义千问7B模型也有不俗表现,胜过所有同等尺寸开源模型和和部分大尺寸开源模型。
开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。
开源生态对促进中国大模型的技术进步与应用落地至关重要。今年7月,阿里云宣布将促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供智能算力、开发工具等全方位服务。2022年阿里云牵头发起AI模型社区魔搭,以AI模型为核心服务AI开发者。目前,魔搭聚集了20多家顶尖人工智能机构贡献的1000多款开源模型。
*开源地址:
魔搭ModelScope:
https://modelscope.cn/models/qwen/Qwen-7B/summary
https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary
Hugging Face:https://huggingface.co/Qwen
GitHub:https://github.com/QwenLM/Qwen-7B
/ END /
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!