等了这么久,百度“文心一言”终于全面开放!不需要使用魔法,打开百度就可以看到Ai体验入口,进点击进入,直接获得一个免费的AI助手。
目前很多AI聊天机器人都需要付费或者消耗积分,像最有名的ChatGPT需要每月20美金的订阅费用,能够免费且功能比较完整的也只有Claude了,这也是我平时使用比较多的一款AI助手。它具有更强的常识推理与记忆能力,可以真正地进行对话,而不仅仅是机械的问答。
那么同样是免费的文心一言和Claude谁更聪明呢?我们选了几个问题来考考他们。
问题1:我想了解一下目前像你一样的人工智能聊天机器人都有哪些?
第一个问题主要想看看AI的理解能力,它的难点在于对“像你一样”的理解。
相比之下Claude明白了我们想表达的意思,给出了谷歌的LaMDA,OpenAI的ChatGPT,Meta的BlenderBot等和Claude同一类的会话式大型自然语言模型。而另外三个答案就不是特别准确了,这可能和Claude数据更新有关,它不是实时联网的模型,回答的内容会有一些滞后。
问题2:和问题1一样(我想了解一下目前像你一样的人工智能聊天机器人都有哪些?)
接下来我又把第一个问题重新问了一遍,想看看AI的回答会不会和之前一样。
从反馈的结果来看,Claude不仅理解了我们表达的意思,整理出来9款产品,其中还包括他自己。同时它还给出了对这个领域的一小段总结。再看文心一言,依然是搜索了“人工智能聊天机器人”这个关键词,并对搜索出来的内容进行了一段总结,还是没能理解我们所表达的意思。
哎~本以为他们可以替代编辑的工作了,结果写的这些内容真的一言难尽。
问题5:写一个调查问卷的导语
可能前面这个工作难度有点高,需要和AI更多的沟通才能得到比较满意的结果,所以接下来问一个简单一点的问题,让AI写一个有固定模式参考的文案
这个需求对于AI来说毫无难度,给出的回复稍作调整就可以直接使用。
问题6:英文文档翻译
百度文心一言支持文档上传,不过要在文心一言的官网连接登陆进去才可以使用,在百度搜索进入的文心一言界面目前还不支持这个功能。
问题7:英文报告理解
这是一份26页一万字左右的一个英文报告,上传给文心一言和Claude后得到了如下反馈。
很明显Claude对这篇内容理解更为深入,反馈要点更具参考价值。相对相比之下,文心一言这个就太水了。
接下来我想继续探讨这篇论文的一些内容,Claude给出的回答是基于这篇论文中提到的一些观点和结论,并且有明确回复我,是从这篇论文中发现的。而文心一言,这个答案似乎已经脱离了论文本身。
下面继续进行追问和讨论,Claude结合论文内容给出了回答,同时还结合了它的知识储备,给我提供了4个需要注意的要点。而文心一言,因为上一轮已经脱离了原始论文,所以回复内容是不在线的。
后面又使用Claude进行了多伦探讨,就不给大家一一展示了。整体使用下来,Claude更贴近真实的人类,你可以跟他进行多个回合的探讨,它的理解能力也是比较优秀,使用起来更舒服,得到回复也更具参考价值。
相比之下,文心一言的理解能力就不太灵光。当然今天这个测试也很片面也不够专业,但从实际使用体验来说,文心一言还有很大提升空间。
不过不可否认的是,作为国内不需要使用“魔法”,也不需要付费的一款AI助手,文心一言表现也算是不错了,尤其是对中国传统文化习俗的认知,还是要比国外产品强一些。比如让人头疼的亲戚关系:我爸爸的姐姐的儿子的女儿,是我的什么亲戚?文心一言给出了正确答案,Claude好像是差辈儿了。