同一个计算问题,问了百度文心,清华智谱,bard,gpt3.5和claude差别还是挺大的

都是问了同一道计算问题,”PowerShell 将日期 2023-08-30 10:00:00 装换成Unix 时间戳“。为什么问这个问题,这问题网上直接找是没有准确答案的,不是使用命令直接就可以转的,需要一点逻辑计算。

不同ai的回答还是差别比较大的。

先说结论,国内的各种ai,真的还有很多路要走。

1、百度文心一言:https://yiyan.baidu.com/ 【这货还不允许f12调试】

直接给出一个错误的计算过程,算的是毫米,要求他计算的是秒,虽然都写了计算过程。但都是错误的。

喂给它一个计算过程,他还是死活不改,用之前错误的方法计算。

2、清华智谱清言:https://chatglm.cn/ 【不知道是不是国内的ai全部不允许 f12 调试】

刚开始就胡说八道,说他胡说,后面给了还是错误的计算过程,两次都是错的。

喂给他一个计算过程,后面他就会根据这个计算,给出的计算过程,但还是错的。至少能连续上下文了。

3、谷歌bard,https://bard.google.com/

刚开始也是错误的计算过程。喂了一个正确的计算过程,后面就知道根据这个过程,写了三个草稿,两个草稿,都是根据这个喂给它的计算过程写出来的,一个草稿是前面写出来的错误的过程。

4、claude,https://claude.ai/chat/

唯一一个,第一次问,就直接给出了一个计算过程,可以正确计算的。也将这个过程同时喂给了其他ai。

5、gpt3.5,我没有4.0所以没有测试。https://chat.openai.com/

之前问过好几次,都是给出错误的计算过程。后来喂过一次Claude的计算过程。这一次居然给出了他自己的计算过程,还是对的。

如果想要好点的ai服务,免费方案claude+gpt3.5就够用了。

评论 1

  1. 看这个结果挺有意思的!

留言

* - 必填