文章主题:人工智能, 大模型, 阿里巴巴, 通义千问

666AI工具大全,助力做AI时代先行者!

在大型模型激战正酣之时,阿里巴巴成为了继 Meta 之后的另一家推动人工智能 (AI) 大模型 “安卓时刻” 潮流的科技巨头。

在8月3日的周四,我国知名云计算服务商阿里云正式将两款具有高达70亿参数的通义千问模型开源,分别为通用模型Qwen-7B和对话模型Qwen-7B-Chat。这两款模型已经在国内首个“模型即服务”开放平台魔搭社区成功上线,并且该平台支持开源、免费以及商业化的使用。

作为一位文章写作高手,我将重新组织原文内容,使其表达更为专业和准确。本文介绍了如何利用开源代码对Qwen-7B和Qwen-7B-Chat进行量化分析。用户可以在自己的消费级显卡上部署和运行这些模型。他们可以通过魔搭社区直接下载这些模型,也可以通过阿里云灵积平台来访问和调用Qwen-7B和Qwen-7B-Chat。为了方便用户使用,阿里云还提供了包括模型训练、推理、部署、精调等一系列服务。

在魔塔社区中,我们可以找到一篇帖子,它详细介绍了通义千问模型的各个方面。这篇帖子涵盖了模型的安装过程、創建空间体验、推理方式以及训练最佳实践。此外,该帖子还提供了模型链接和下载情况截图,方便读者更好地理解和掌握。

根据公开披露的信息,Qwen-7B模型在进行预训练时,利用了超过2.2万亿个经过去重和筛选的数据片段。作为一款具备处理多种语言能力的基础模型,它的上下文窗口长度可达8K。该模型包含了大量的中英文等多语言素材、代码、数学等各种类型的数据,全面覆盖了网络空间的各种文本、百科、书籍、代码、数学以及各领域的专业内容。

MMLU评测结果表明,Qwen-7B在英文综合能力方面表现卓越,成为当前国内外同类型开源预训练模型的佼佼者,其竞争力甚至超越了更大规模的模型。而在中文评测方面,Qwen-7B在C-Eval验证集上展现了更高的性能,成为同规模现有模型中的优势者,甚至与更大规模模型相媲美。

以下为Qwen-7B的MMLU 5-shot准确率结果对比。

在Qwen-7B的基础上,阿里云使用对齐机制打造了基于基座模型的AI助手Qwen-7B-Chat。它是基于Transformer的中英文对话大语言模型,已实现与人类认知对齐。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。

无论是在C-Eval验证集上,还是在MMLU评测集上,Qwen-7B-Chat模型的zero-shot准确率均在同类对齐模型中表现较优。

以下为C-Eval测试集上的zero-shot准确率结果对比。

通义千问的开源后,阿里云成为国内首个加入大模型开源行列的大型科技企业。今年7月,微软宣布,联手Meta发布开源AI模型的可商用版本Llama 2,提供OpenAI和谷歌模型的平替产品。也是在7月,智谱AI及清华KEG实验室公布,中国顶尖开源大模型ChatGLM2-6B允许免费商用

华尔街见闻此前文章提及,开源模型的好处包括用户的接受率更高,然后输入更多数据供人工智能处理。LLM拥有的数据越多,其功能就越强大。此外,开源模型使研究人员和开发人员能够发现和解决漏洞,同时提高技术和安全性。

今年4月的2023阿里云峰会上,阿里巴巴宣布向企业开放通义千问,企业可以调用通义千问的能力训练自己的大模型。

阿里云智能集团首席技术官(CTO)周靖人当时介绍,未来企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自身的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

阿里巴巴集团CEO兼阿里云智能集团CEO张勇当时称,阿里巴巴所有产品未来都将接入通义千问大模型。

张勇表示,面向 AI 时代,所有产品都值得用大模型重做一次,而基于这一信念,阿里云也希望帮助更多企业用上大模型,让每家企业都能基于通义千问,拥有具备自己行业能力的专属大模型。

举报/反馈

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注