惊天大模型！阿里云推出70亿参数通义千问模型，开源免费！

文章主题：人工智能, 大模型, 阿里巴巴, 通义千问

在大型模型激战正酣之时，阿里巴巴成为了继 Meta 之后的另一家推动人工智能 (AI) 大模型 “安卓时刻” 潮流的科技巨头。

在8月3日的周四，我国知名云计算服务商阿里云正式将两款具有高达70亿参数的通义千问模型开源，分别为通用模型Qwen-7B和对话模型Qwen-7B-Chat。这两款模型已经在国内首个“模型即服务”开放平台魔搭社区成功上线，并且该平台支持开源、免费以及商业化的使用。

作为一位文章写作高手，我将重新组织原文内容，使其表达更为专业和准确。本文介绍了如何利用开源代码对Qwen-7B和Qwen-7B-Chat进行量化分析。用户可以在自己的消费级显卡上部署和运行这些模型。他们可以通过魔搭社区直接下载这些模型，也可以通过阿里云灵积平台来访问和调用Qwen-7B和Qwen-7B-Chat。为了方便用户使用，阿里云还提供了包括模型训练、推理、部署、精调等一系列服务。

在魔塔社区中，我们可以找到一篇帖子，它详细介绍了通义千问模型的各个方面。这篇帖子涵盖了模型的安装过程、創建空间体验、推理方式以及训练最佳实践。此外，该帖子还提供了模型链接和下载情况截图，方便读者更好地理解和掌握。

根据公开披露的信息，Qwen-7B模型在进行预训练时，利用了超过2.2万亿个经过去重和筛选的数据片段。作为一款具备处理多种语言能力的基础模型，它的上下文窗口长度可达8K。该模型包含了大量的中英文等多语言素材、代码、数学等各种类型的数据，全面覆盖了网络空间的各种文本、百科、书籍、代码、数学以及各领域的专业内容。

MMLU评测结果表明，Qwen-7B在英文综合能力方面表现卓越，成为当前国内外同类型开源预训练模型的佼佼者，其竞争力甚至超越了更大规模的模型。而在中文评测方面，Qwen-7B在C-Eval验证集上展现了更高的性能，成为同规模现有模型中的优势者，甚至与更大规模模型相媲美。

以下为Qwen-7B的MMLU 5-shot准确率结果对比。

在Qwen-7B的基础上，阿里云使用对齐机制打造了基于基座模型的AI助手Qwen-7B-Chat。它是基于Transformer的中英文对话大语言模型，已实现与人类认知对齐。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。

无论是在C-Eval验证集上，还是在MMLU评测集上，Qwen-7B-Chat模型的zero-shot准确率均在同类对齐模型中表现较优。

以下为C-Eval测试集上的zero-shot准确率结果对比。

通义千问的开源后，阿里云成为国内首个加入大模型开源行列的大型科技企业。今年7月，微软宣布，联手Meta发布开源AI模型的可商用版本Llama 2，提供OpenAI和谷歌模型的平替产品。也是在7月，智谱AI及清华KEG实验室公布，中国顶尖开源大模型ChatGLM2-6B允许免费商用。

华尔街见闻此前文章提及，开源模型的好处包括用户的接受率更高，然后输入更多数据供人工智能处理。LLM拥有的数据越多，其功能就越强大。此外，开源模型使研究人员和开发人员能够发现和解决漏洞，同时提高技术和安全性。

今年4月的2023阿里云峰会上，阿里巴巴宣布向企业开放通义千问，企业可以调用通义千问的能力训练自己的大模型。

阿里云智能集团首席技术官（CTO）周靖人当时介绍，未来企业在阿里云上既可以调用通义千问的全部能力，也可以结合企业自身的行业知识和应用场景，训练自己的企业大模型。比如，每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

阿里巴巴集团CEO兼阿里云智能集团CEO张勇当时称，阿里巴巴所有产品未来都将接入通义千问大模型。

张勇表示，面向 AI 时代，所有产品都值得用大模型重做一次，而基于这一信念，阿里云也希望帮助更多企业用上大模型，让每家企业都能基于通义千问，拥有具备自己行业能力的专属大模型。

举报/反馈

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复