没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。

9.11和9.9哪个更大?就此问题,测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。

大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。

目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。

在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文字思维而不是数字思维。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。

分不清13.8和13.11哪个大?

网友吵翻天

这不禁让辽婶儿想起了前不久的一个热搜,不光AI搞不清楚小数点后面的数字大小,就连很多网友都被难住了……

在最近一期的《歌手》节目中,孙楠与外国歌手的微小分数差异,竟引发了网友关于13.8和13.11大小比较的讨论。

据悉,在最新人教版小学四年级数学下册课本中,我们可以找到相关知识点:比较两个小数的大小,先看它们的整数部分,整数部分大的那个数就大;整数部分相同的,十分位上的数大的那个数就大;十分位上的数也相同的,百分位上的数大的那个数就大……

数学到底有多重要?

当年学的数学知识你还记得多少?“宇宙之大,粒子之微,火箭之速,化工之巧,地球之变,生物之谜,日用之繁,无处不用数学。”

为何要学数学?

或许,这就是答案↓↓

综合第一财经日报、@广州日报、@人民日报

来源: 辽沈晚报

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注