自从AI语言大模型开始普及后,我经常使用,有些时候用他们来计算一些简单的数学题,有时也会拿来给上小学的孩子出题用,这样一来就极大程度地减低了家长的负担。但在数学方面,文心一言、豆包、讯飞星火哪个运算结果比较准确呢,我们来测试一下。

因为我是买的电车,所以我平常有记录加油充电费用的习惯,就让他们仨给我计算一下总费用吧。这种题就很简单了,就是简单的相加即可,并没有复杂的数学运算,小学三年级的同学都可以轻松完成。我的充电和加油记录如下图。

首先,我们来请文星一言进行计算。

注意了,我测试用的文心一言、豆包、讯飞星火都是免费的,算是平民级别的吧。

文心一言计算的答案。

文星一言先计算的加油300元,然后计算的充电费用575.27元,合计费用。最后,加油和充电的总费用为:300+575.27=875.27(元)。可以看出逻辑还算不错。至于答案对不对,我也不知道,因为我还没人工进行计算,姑且放着,看看豆包同学计算的答案。

下面,请豆包同学进行计算。

直接将向文心一言提问的内容复制粘贴给豆包。

问题是相同的,直接复制。

接下来,看豆包同学的计算过程。

这是豆包给出的计算过程和答案。

看得出,豆包同学更像小学生计算,一步一步的逐个计算,主打一个步步为营,稳步推进。他给出的答案是合计880.29元。

出现了两个答案,文心一言是875.27元,豆包给出的是880.29元,那这个答案到底谁正确呢,我比较懒,还是请讯飞星火算一下吧。

下面,请讯飞星火表演。

直接将向文心一言提问的内容复制粘贴给豆包。

问题是和前两个一样的,直接复制粘贴的

接下来,看讯飞星火的计算过程。

感觉很厉害的样子

答案揭晓

讯飞星火用了代码生成工具,我也不晓得啥叫代码生成工具,感觉很厉害的样子。他给出的总费用为880.29元,和豆包给出的答案一样。

经过前面的计算,文心一言给出的答案是875.27元,豆包和讯飞星火给出了相同的答案,880.29元。那结果就很显然了,要么文心一言错了,要么就是豆包和讯飞星火错了。

接下来,就只有进行人工计算了。

将信息逐项手动输入到wps表格中。

利用求和公式,得到的答案是880.29元。看来文心一言真的是算错了。

我又让文星一言再次进行了计算,看他校正后的答案会是多少?

文星一言给出的答案依然是875.27元。

于是,我又质问他:为什么豆包和讯飞星火计算出来的答案是880.29元,你却计算的是875.27元?看他如何应对。

这次,文心一言很确定的告诉我:总费用确实是875.27元。至于另外两个计算出的880.29元答案,可能是由于某种计算错误或数据输入错误导致的。文心一言还是有傲骨的。

看来文心一言还不死心,我再来问问他。

他又继续进了进行了,感觉很详细,但在计算充电总费用的时候,他给出的答案依然是575.27元,我对他列出的数值进行了逐项核对,30 + 44.76 + 32.21 + 38.57 + 47.6 + 13.47 + 38 + 48.22 + 44 + 27 + 33.83 + 43.23 + 47.69 + 44 + 28.87 + 18.84,这些都没错,但将这一串数字进行相加,答案却算错了,正确的应当为580.29,他却计算为575.27

看完,大家心里有个答案了吧。

点击扫码分享至微信