通义千问AI挑战赛盛大开启：720亿参数模型Qwen-72B震撼来袭

文章主题：首届通义千问AI挑战赛, 通义开源模型家族, Qwen-72B, 人工智能挑战赛

首届通义千问AI挑战赛开赛，参赛者可畅玩通义开源模型家族

在12月1日，首届“通义千问AI挑战赛”正式开启，这一盛大的比赛向所有参赛者提供了免费的机会，让他们可以尽情体验通义开源模型家族，其中包括最新发布的720亿参数模型Qwen-72B。 Organizers are providing a whopping 500,000 RMB worth of free cloud computing resources and generous prizes to the participants. The competition is divided into two categories: Algorithm and Agent. The Algorithm category focuses on the micro-training of the通义千问大模型, with the aim of exploring the code capabilities of open source models through high-quality data. On the other hand, the Agent category encourages developers to create new AI applications based on the通义千问大模型 and the魔搭社区的Agent-Builder framework, promoting the practical application of large models in various industries. Starting from now, developers can sign up for the competition on the Tianchi platform.

通义千问720亿参数模型宣布开源，部分性能超越闭源GPT-4

原内容为：今天中午，新浪科技报道了一则关于阿里云通义千问720亿参数模型Qwen-72B的开源新闻。这个模型采用了基于3T tokens高质量数据的训练方式，并在10个权威基准测试中取得了最佳成绩，甚至超过了闭源的GPT-3.5和GPT-4。这一成果展示了我国人工智能技术的最新成果和发展水平。

在英语任务中，Qwen-72B在MMLU基准测试中荣获开源模型最高分，展示了其卓越的性能；在中文任务上，Qwen-72B在C-Eval、CMMLU、GaokaoBench等基准测试中成绩斐然，甚至超过了强大的GPT-4；在数学推理领域，Qwen-72B在GSM8K、MATH测评中表现突出，成为断层式领先的开源模型；而在代码理解方面，Qwen-72B在HumanEval、MBPP等测评中，其表现更是有了显著提升，实现了代码能力的質变。

据阐述，Qwen-72B具备处理最长可达32k字符串的能力，其在长文本理解测试集LEval上的表现甚至超过了ChatGPT-3.5-16k。研发团队针对Qwen-72B进行了指令遵循和工具使用的优化，以便让这款模型能够更轻松地被下游应用集成。例如，Qwen-72B配备了强大的系统指令（System Prompt）功能，用户只需给出一个关键词提示，AI助手就能根据需求扮演特定角色或执行相应任务。

自从Qwen-72B的开源发布以来，通义千问再次开放了两个大模型，分别是18亿参数的Qwen-1.8B和音频大模型Qwen-Audio。至此，通义千问已经成功开源了四款大型语言模型，包括18亿、70亿、140亿和720亿参数的模型，同时还推出了视觉理解和音频理解两款多模态大模型，实现了“全尺寸、全模态”的开源目标。

业界最强开源模型，填补中国LLM开源领域空白

【在10大权威测评中，通义千问720亿参数模型获得开源模型最优成绩】

【通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4】

【用户仅用一句提示词就可创建自己的AI助手】

此前，我国的大模型市场尚无能够与Llama 2-70B相媲美的优质开源模型。然而，Qwen-72B的出现，不仅弥补了国内这一领域的空白，更以其高性能、高可控和高性价比的特点，为我国人工智能市场带来了堪比商业闭源大模型的选择。借助Qwen-72B，大中型企业得以开发商业应用，而高校和科研院所则可以开展AI for Science等科研活动。

从1.8B到72B，通义千问率先实现全尺寸开源

如果说Qwen-72B“向上摸高”，抬升了开源大模型的尺寸和性能天花板；发布会上的另一开源模型Qwen-1.8B则“向下探底”，成为尺寸最小的中国开源大模型，推理2K长度文本内容仅需3G显存，可在消费级终端部署。

从18亿、70亿、140亿到720亿参数规模，通义千问成为业界首个“全尺寸开源”的大模型。用户可在魔搭社区直接体验Qwen系列模型效果，也可通过阿里云灵积平台调用模型API，或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配，推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

阿里云是国内最早开源自研大模型的科技企业，8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单，得到中小企业和个人开发者的青睐，累计下载量超过150万，催生出150多款新模型、新应用。发布会现场，多位开发者伙伴现身说法，分享了他们用Qwen开发专属模型和特定应用的实践。

阿里云CTO周靖人表示，开源生态对促进中国大模型的技术进步与应用落地至关重要，通义千问将持续投入开源，希望成为“AI时代最开放的大模型”，与伙伴们共同促进大模型生态建设。

通义千问基座模型持续进化，多模态探索业界领先

通义千问在多模态大模型领域的探索也领先业界一步，当天，阿里云首次开源音频理解大模型Qwen-Audio。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频，要求模型给出对音频的理解，甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

通义大模型能“听”也能“看”。通义千问8月开源出视觉理解大模型Qwen-VL，迅速成为国际开源社区最佳实践之一。本次发布会又宣布了Qwen-VL的重大更新，大幅提升通用OCR、视觉推理、中文文本理解基础能力，还能处理各种分辨率和规格的图像，甚至能“看图做题”。不论从权威测评成绩还是真人体验的效果看，Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通义千问闭源模型也在持续进化，一个月前发布的通义千问2.0版闭源模型，最近已进阶至2.1版，上下文窗口长度扩展到32k，代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。用户可以在通义千问APP免费体验最新版本的闭源模型。返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复