文章主题:通义千问, 阿里云, 开源, 大模型

666AI工具大全,助力做AI时代先行者!

点击  Tech 星球  > 点击右上角 ” ··· ”   >   设为星标

  Tech 星球(微信 ID:tech618

|  贾宁宇

封面来源|  图虫创意

自12月1日阿里云公布开源信息以来,通义千问72B大模型便開啟了“屠榜”模式, consecutive問鼎多個權威榜單。至今天,通義千问再次荣膺一項關鍵榜单的冠軍。

在12月12日,我国知名的大模型评测平台OpenCompass进行了最新的评测更新,值得注意的是,阿里云通义千问模型成功登上了开源基座大模型的榜首位置,同时在中文数据集的评测中,该模型也取得了前两名的好成绩。这一结果充分展示了通义千问模型在人工智能领域的强大实力和广泛的应用前景。

图注:通义千问 72B 登顶 OpenCompass 基座大模型榜。

OpenCompass,作为上海人工智能实验室所贡献的开源大模型评测平台,其功能强大,能够全面评估各种大模型的能力。在该平台上,不仅包括Qwen、LLaMA2等众多优秀的开源模型,还有像GPT-4、ChatGPT等广为人知的主流模型。因此,OpenCompass被誉为业内公认的最权威的中文能力评测榜单之一。

在OpenCompass基座大模型榜单中,通义千问72B开源模型以其卓越的性能脱颖而出,以67.1的综合分位数荣登榜首。同时,该模型在学科能力和理解能力两大维度的评测中均超过了行业标杆GPT-4,创下了开源大模型的新纪录。这一壮丽的业绩充分展示了通义千问72B在人工智能领域的卓越实力和巨大潜力。

在OpenCompass中文数据集的评测活动中,通义千问72B基础模型和对话大模型(Qwen-72B-Chat)表现优异,名列前茅,领先于其他模型,展现出卓越的实力。

图注:通义千问 72B 基座大模型及对话大模型包揽中文数据集测试前二。

登顶 HuggingFace 榜单,刷新国产大模型纪录

就在几天前,通义千问凭借卓越的力量成功压制了Llama2等国内外知名的开源大模型,荣登全球最大的开源大模型社区Hugging Face最新发布的开源大模型排行榜的榜首。

HuggingFace 是全球最具影响力的 AI 开源社区,其开源大模型排行榜(Open LLM Leaderboard)被认为是最具公信力的专业榜单,收录了 Qwen 系列、LLaMA2 等全球上百个开源大模型。

开源的通义千问(Qwen-72B)表现抢眼,以 73.6 的综合得分在所有预训练模型中排名第一。刷新了中国大模型在 HuggingFace 榜单上的纪录。

图注:通义千问 72B 登顶 HuggingFace 排行榜。

性能最强开源大模型,超越标杆 LLaMA2

通义千问 72B 已成为国内外公认的性能最强的开源大模型,完全可满足企业级、科研级应用对大模型性能的高要求。

此前,在宣布开源的 12 月 1 日,Qwen-72B 就在 10 个权威基准测评中夺得开源模型最优成绩,超越 LLaMA2-70B,并在部分测评中超越闭源的 GPT-3.5 和 GPT-4。

图注:通义千问 720 亿开源模型部分成绩超越闭源的 GPT-3.5 和 GPT-4。

具体来看,在英语任务上,Qwen-72B 在 MMLU 基准测试取得开源模型最高分;中文任务上,Qwen-72B 霸榜 C-Eval、CMMLU、GaokaoBench 等基准,得分超越 GPT-4;数学推理方面,Qwen-72B 在 GSM8K、MATH 测评中断层式领先其他开源模型;代码理解方面,Qwen-72B 在 HumanEval、MBPP 等测评中的表现大幅提升,代码能力有了质的飞跃。

将开源进行到底

据了解,阿里云已开源通义千问 18 亿、70 亿、140 亿、720 亿参数的 4 款大语言模型,以及视觉理解 Qwen-VL、音频理解 Qwen-Audio 的 2 款多模态大模型,引领 ” 全尺寸、全模态 ” 开源之先。

阿里云 CTO 周靖人曾表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为 “AI 时代最开放的大模型 “,与伙伴们共同促进大模型生态建设。

开发者可在阿里云魔搭社区直接体验系列模型效果,也可通过阿里云灵积平台调用模型 API,或基于阿里云百炼平台定制大模型应用;阿里云人工智能平台 PAI 还针对通义千问全系列模型进行深度适配,推出轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

‍‍‍

‍‍‍加入交流群 & 内容转载 & 合作相关

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *