以下是一些常见的中国 AI 大模型排行榜及相关信息:

华算人工智能研究院、全国高校人工智能与大数据创新联盟 “大模型中国 50 强榜单 (2024)” 2

百度文心一言:基于百度公司研发的知识增强大模型,从数万亿数据和数千亿知识中融合学习,具备知识增强、对话交互、检索增强、对话增强以及高精准度等特色。智谱清言:融合了先进的预训练技术和有监督微调技术,实现了对文本和代码的深度理解和生成。科大讯飞星火认知大模型:采用先进的深度学习技术和算法,拥有文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模交互七大核心能力。360 智脑大模型:依托 360 公司多年积累的大算力、大数据、工程化等关键技术优势,集成了 360GPT 大模型、360CV 大模型、360 多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能 。抖音云雀大模型:凭借强大的深度学习和自然语言处理技术,能够实现对文本、图像等信息的深度理解和智能生成,为内容创作领域带来变革。百川百应大模型:实现了高效便民服务,在政务服务、反诈劝阻、技术创新和应用探索以及推动人工智能产业发展等方面贡献显著。中国科学院紫东太初大模型:以卓越的感知、认知和决策能力,实现了对人工智能技术的进一步拓展和深化,平台开放后推动了相关研究和应用的进步。商汤日日新大模型:以其先进的自然语言处理、文生图以及视频生成技术,为人工智能领域带来新突破,还通过提供全链条 MaaS 大模型即服务,助力中小企业数字化转型。阿里巴巴通义千问大模型:提供丰富的模型选择,降低了 AI 技术的使用门槛,海外开源社区累计下载量已突破 300 万,具有强大的文本生成能力,可应用于多种自然语言文本生成和创作场景。华为盘古 NLP 大模型:是华为在 AI 领域的重大突破,代表了自然语言处理技术的最新进展,拥有超过 2 亿个参数,是目前最大的中文预训练语言模型之一,支持多种自然语言处理任务 。

《中文大模型基准测评 2024 年度 4 月报告》5

baichuan3:文科、理科能力较为均衡,知识百科能力超越 gpt-4-turbo,逻辑推理能力拔得头筹,计算、代码、工具使用能力排名国内前三,应用场景广泛,适用于教育、医疗、金融等垂直行业。智谱 glm-4:表现出色,位列国内大模型前列,在数据和算法方面有优势,能较好地处理各种复杂的语言任务。通义千问 2.1:具有较强的文本生成能力,可用于自动摘要生成、文档自动化生成、创意文案生成等。文心一言 4.0:针对中文进行了优化,能够深刻理解中文特色和语境,提供较为精准的中文处理服务。moonshot(kimi):在处理长文本内容方面具有优势,能很好地理解和处理长篇文档、会议纪要等 。

Flageval 大模型评测平台 2024 年 6 月结果5

doubao-pro (豆包大模型):在有标准答案的 “客观评测” 中以 75.96 分排名第二,是得分最高的国产大模型,其数学能力、知识运用、任务解决等多项能力在客观评测和主观评测中都有出色表现,其中知识运用和数学能力得分排名客观评测第一、主观评测前三,任务解决测试得分在主客观评测中均排名前三 。

中国信息通信研究院大模型安全基准测试 aisafetybench2024 年 q15

360 智脑:综合排名第一,在安全可用评分和安全评分两个方面表现良好,安全性能优势大。

LiveBench 最新榜单 10

阶跃星辰 Step-2:技术表现位列中国基座大模型第一,成绩逼近 OpenAI 的 o1-mini-2024-09-12,超越 gpt-4o-2024-08-06、gemini-1.5-pro-002 等国际主流模型,位列全球第五。在 IF Average(Instruction Following)一项表现突出,对语言生成细节有很强的控制力,能更好地理解和遵循人类指令 。

载标准:点击👇👇👇名片关注,回复:标准机械设计手册

 往期回顾 

GBT3086 高碳铬不锈轴承钢GBT1172-1999 黑色金属硬度及强度换算值导轨滑块在使用当中的结构配置直线导轨的拼接使用GBT 3-1997普通螺纹收尾、肩距、退刀槽和倒角

   如需更多标准可在下方留言   

本公众号所分享图文素材资源均源自网络,旨在提供信息便利,版权归原作者所有。本公众号对由软件、资源内诱导或误操作等导致的付费或其他损失,不承担任何责任。如对发布资源及版权有异议,请随时联系删除。所有资源免费分享,仅用于个人学习交流研究,严禁用于非法交易或商业用途。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注