文章主题:数学题测试, 媒体, 大模型, 数学能力
站长之家 6月9日 消息:今日,科大讯飞举办了讯飞星火认知大模型V1.5升级发布会,正式推出了新版本。会上,科大讯飞展示了大模型在今年高考中的答题能力,讯飞星火凭借出色表现成为了答题正确率最高、“最聪明”的AI大模型。
打开凤凰新闻,查看更多高清图片
在一场针对数学题目的测试中,媒体选择了高考数学试卷的前十道填空题,分别邀请百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑以及ChatGPT来解答。经过分析,测试结果表明这五款大模型在处理数学题目时的能力存在明显区别。其中,讯飞星火表现最为出色,成功解答了5道题目,正确率达到了50%,因此成为了大模型中数学能力最强的选手。紧随其后的是百度文心一言和ChatGPT,这两款大模型分别答对了4道题目,正确率为40%。总的来说,在这场数学题目的测试中,讯飞星火认知大模型展现了卓越的数学能力,而百度文心一言和ChatGPT也取得了不错的成绩。然而,360智脑在此次测试中的表现相对较差,未能解答出任何一道题目。
在语文主观作答方面,ChatGPT表现出卓越的得分能力,其表现优于文心一言和讯飞星火,尽管这两者的得分相差无几,但在高考作文方面仍以ChatGPT为主导。而在英语考试领域,讯飞星火和ChatGPT则明显超越了其他模型,展示出了强大的优势。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

