数学题大比拼：五款人工智能助手的表现你了解吗？

文章主题：数学题测试, 媒体, 大模型, 数学能力

站长之家 6月9日消息:今日，科大讯飞举办了讯飞星火认知大模型V1.5升级发布会，正式推出了新版本。会上，科大讯飞展示了大模型在今年高考中的答题能力，讯飞星火凭借出色表现成为了答题正确率最高、“最聪明”的AI大模型。

打开凤凰新闻，查看更多高清图片

在一场针对数学题目的测试中，媒体选择了高考数学试卷的前十道填空题，分别邀请百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑以及ChatGPT来解答。经过分析，测试结果表明这五款大模型在处理数学题目时的能力存在明显区别。其中，讯飞星火表现最为出色，成功解答了5道题目，正确率达到了50%，因此成为了大模型中数学能力最强的选手。紧随其后的是百度文心一言和ChatGPT，这两款大模型分别答对了4道题目，正确率为40%。总的来说，在这场数学题目的测试中，讯飞星火认知大模型展现了卓越的数学能力，而百度文心一言和ChatGPT也取得了不错的成绩。然而，360智脑在此次测试中的表现相对较差，未能解答出任何一道题目。

在语文主观作答方面，ChatGPT表现出卓越的得分能力，其表现优于文心一言和讯飞星火，尽管这两者的得分相差无几，但在高考作文方面仍以ChatGPT为主导。而在英语考试领域，讯飞星火和ChatGPT则明显超越了其他模型，展示出了强大的优势。

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

ChatGPT GPT 文心一言星火通义千问

相关文章

发表回复 取消回复

发表回复取消回复