文章主题:讯飞星火, 大模型评测, 国产大模型, 人工智能

666AI工具大全,助力做AI时代先行者!

历经多次迭代升级,讯飞星火现正式上线!

近期,讯飞星火认知大模型V2.0因其卓越的表现和高精度的预测能力,在MIT科技评论发布的我国大模型评测中,成功夺得了最高分数,荣获了“最聪明”的国产大模型荣誉。值得一提的是,讯飞星火APP于9月5日正式向公众开放,让广大用户能够抢先体验这款被誉为“最聪明”的国产大模型的强大功能。

MIT科技评论全面审视了大型模型开发与商业化的效能、社会观感以及发展前景等多方面因素,从而选定四家具有代表性的中文大模型平台进行了全方位、科学性的评估。评估所使用的测试集包含600道题目,覆盖了语言、数学、理科综合、文科综合、逻辑思维、编程技能、综合知识以及安全性等八大一级类别,共计126个二级分类,以及290个三级标签。

在众多评测维度中,讯飞星火的表现独树一帜,堪称卓越。在语言专项评测中,其得分为85.73%,位居行业之首;在数学专项评测中,得分为77.75%,同样稳居第一宝座;在理科综合评测中,以78.50%的得分率独领风骚;在逻辑思维评测中,得分为81.25%,成绩斐然。此外,在编程能力和综合知识方面,讯飞星火也表现优异,分别获得了80%和80.61%的高分,堪称领导者。特别是在数学评测中,讯飞星火以77.75%的得分率遥遥领先于其他平台,尤其是在几何和情景应用方面的表现更是令人瞩目。

科大讯飞是目前在全民开放大模型领域首个符合条件的A股上市公司。该公司在今年5月6日正式推出“讯飞星火认知大模型”,并在同年6月9日、8月15日分别发布了讯飞星火V1.5和V2.0版本,这些版本均成功突破了代码能力和多模态能力的限制。

作为一款具备强大核心能力的智能编码助手iFlyCode1.0,以及讯飞智作2.0、教育数字基座应用开发助手、星火教师助手、星火语伴2.0和AI学习机等一系列应用和产品的支持,科讯飞不断丰富和完善其生态体系。同时,科讯飞还与华为联手推出了星火一体机,为企业提供了打造个性化大规模模型的可能。

值得一提的是,科大讯飞表示,到今年10月24日,讯飞星火将实现通用模型对标ChatGPT 3.5的目标。这意味着讯飞星火在中文能力方面将超越ChatGPT 3.5,在英文能力方面相当。返回搜狐,查看更多

责任编辑:

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注