一道小学生加法运算，文心一言、豆包、讯飞星火答案差别这么大！

自从AI语言大模型开始普及后，我经常使用，有些时候用他们来计算一些简单的数学题，有时也会拿来给上小学的孩子出题用，这样一来就极大程度地减低了家长的负担。但在数学方面，文心一言、豆包、讯飞星火哪个运算结果比较准确呢，我们来测试一下。

因为我是买的电车，所以我平常有记录加油充电费用的习惯，就让他们仨给我计算一下总费用吧。这种题就很简单了，就是简单的相加即可，并没有复杂的数学运算，小学三年级的同学都可以轻松完成。我的充电和加油记录如下图。

首先，我们来请文星一言进行计算。

注意了，我测试用的文心一言、豆包、讯飞星火都是免费的，算是平民级别的吧。

文心一言计算的答案。

文星一言先计算的加油300元，然后计算的充电费用575.27元，合计费用。最后，加油和充电的总费用为：300+575.27=875.27（元）。可以看出逻辑还算不错。至于答案对不对，我也不知道，因为我还没人工进行计算，姑且放着，看看豆包同学计算的答案。

下面，请豆包同学进行计算。

直接将向文心一言提问的内容复制粘贴给豆包。

问题是相同的，直接复制。

接下来，看豆包同学的计算过程。

这是豆包给出的计算过程和答案。

看得出，豆包同学更像小学生计算，一步一步的逐个计算，主打一个步步为营，稳步推进。他给出的答案是合计880.29元。

出现了两个答案，文心一言是875.27元，豆包给出的是880.29元，那这个答案到底谁正确呢，我比较懒，还是请讯飞星火算一下吧。

下面，请讯飞星火表演。

直接将向文心一言提问的内容复制粘贴给豆包。

问题是和前两个一样的，直接复制粘贴的

接下来，看讯飞星火的计算过程。

感觉很厉害的样子

答案揭晓

讯飞星火用了代码生成工具，我也不晓得啥叫代码生成工具，感觉很厉害的样子。他给出的总费用为880.29元，和豆包给出的答案一样。

经过前面的计算，文心一言给出的答案是875.27元，豆包和讯飞星火给出了相同的答案，880.29元。那结果就很显然了，要么文心一言错了，要么就是豆包和讯飞星火错了。

接下来，就只有进行人工计算了。

将信息逐项手动输入到wps表格中。

利用求和公式，得到的答案是880.29元。看来文心一言真的是算错了。

我又让文星一言再次进行了计算，看他校正后的答案会是多少？

文星一言给出的答案依然是875.27元。

于是，我又质问他：为什么豆包和讯飞星火计算出来的答案是880.29元，你却计算的是875.27元？看他如何应对。

这次，文心一言很确定的告诉我：总费用确实是875.27元。至于另外两个计算出的880.29元答案，可能是由于某种计算错误或数据输入错误导致的。文心一言还是有傲骨的。

看来文心一言还不死心，我再来问问他。

他又继续进了进行了，感觉很详细，但在计算充电总费用的时候，他给出的答案依然是575.27元，我对他列出的数值进行了逐项核对，30 + 44.76 + 32.21 + 38.57 + 47.6 + 13.47 + 38 + 48.22 + 44 + 27 + 33.83 + 43.23 + 47.69 + 44 + 28.87 + 18.84，这些都没错，但将这一串数字进行相加，答案却算错了，正确的应当为580.29，他却计算为575.27

看完，大家心里有个答案了吧。

点击扫码分享至微信

一道小学生加法运算，文心一言、豆包、讯飞星火答案差别这么大！

相关文章

你的AI大模型可能正在“裸奔” 这三重风险必须警惕！

原创俄罗斯收到德左地区紧急求援，欧洲最大军火库不能被乌军得到，俄罗斯是否出兵成关键！

多模态革命：三大引擎重塑AI未来

一道小学生加法运算，文心一言、豆包、讯飞星火答案差别这么大！

相关文章

你的AI大模型可能正在“裸奔” 这三重风险必须警惕！

原创 俄罗斯收到德左地区紧急求援，欧洲最大军火库不能被乌军得到，俄罗斯是否出兵成关键！

多模态革命：三大引擎重塑AI未来

原创俄罗斯收到德左地区紧急求援，欧洲最大军火库不能被乌军得到，俄罗斯是否出兵成关键！