钉钉总裁吐槽百度,AI搜索到底哪家强?

这几天,古老的搜索行业又有一些新话题。

“我如果买了一个设备不知道怎么用,你去视频号搜,人家会告诉你大量的结果,这个结果跟百度就不一样,估计百度出来的前10条结果没有一条是你想要的,这就是有了智能化的能力之后,交互的感觉就完全不一样。”

叶军吐槽背后,是AI大模型正在掀起的一轮搜索引擎新革命。

我们用百度来简单测试一下,可以发现给出的答案只符合:小吃店、粽子和广州天河区三个关键词,而店址则分布在天河的东西南北。另外百度搜索还仅支持39个字符以内的问题,导致其直接忽略了咸肉蛋黄粽等要求。

图源:雷科技

想要从中找到符合要求的店铺显然有点难,还不如在附近随便找个实体店的老板问问,或者打开大众点评之类的App,按位置排序后逐个点击查看。

当然,这份回答肯定远称不上好,甚至还不如你在大众点评或者美团搜索“粽子”,然后按顺序排序的效果好,但是如果我想找的不是吃喝玩乐的店,而是一家五金店呢?或者说一家有出售露营帐篷的户外设备店?

传统的App只能满足一定范围内的需求,而AI搜索却可以基于公共网络的庞大数据库,为你提供任意行业、疑问的解答(前提是不违法)。谷歌、百度等搜索引擎巨头都一致认为AI搜索会是搜索引擎的下一代,正是因为其可以大幅度降低用户获取正确答案所需的成本。

效率就是金钱,搜索引擎到了必须革新的时候。不同AI搜索引擎表现到底如何?雷科技选取了5大AI搜索引擎(百度简单搜索、字节小悟空、Kimi、360AI搜索和智谱清言)进行了一番PK,AI搜索到底表现如何?

不过,这也让我很好奇各个AI在面对这种涉及确切地点、复杂要求的提问时,到底会给出怎样的回答,于是,我继续以“找一家小吃店”的要求,向各个AI进行提问,并得到了以下回答:

简单搜索(百度)

360AI搜索

小悟空(字节)

智谱清言

Kimi

从五个不同AI的回答中,其实可以很简单的看出各个AI的联网搜索能力,其中简单搜索(百度)的表现最好,Kimi和360AI搜索则次之,智谱清言和小悟空(原字节旗下悟空搜索)的表现则让人失望。

这也暴露出目前AI搜索的一个问题,就是数据库的更新受限于网页内容的更新,有时候会将一些过时的信息也收录进去,输出具有误导性的结果。

不过简单搜索已经是所有AI中唯一以“小吃店”为主要检索对象的AI,反观第二梯队的Kimi和360AI搜索都将一堆火锅店、饭店、茶餐厅塞到了搜索结果中,让人看了颇为无语。

虽然严格来说360AI搜索和Kimi的答案都不算合格,但是相较于小悟空(字节)和智谱清言,至少他们的回答符合了部分要求。至于后两者,则是一个“摆烂”,另一个让我去北京路步行街,根据高德地图给出的导航信息,天河客运站到北京路驾车需要40分钟左右,步行则是两小时三十八分钟。

仅就目前的体验来说,AI搜索在遇到涉及现实地点的提问时,根据搜索引擎的性能不同,呈现出来的结果会有非常大的区别,作为国内搜索引擎老大的百度拥有天生优势,加上文心一言大模型的出色表现,使得回答质量明显优于其他AI大模型。

而且,你会发现简单搜索和360AI搜索的回答都有点不同,他们在AI回答之外还给出了网页搜索的结果。如果AI的回答不能让你满意,可以翻一下网页看看有没有合适的,其他AI则是直接输出答案,并提供参考网页的链接,这也是谷歌希望打造的新一代搜索引擎的形式。

在测试了国内几个AI的表现后,我对谷歌Gemini的表现产生了好奇,考虑到他们的CEO刚在开发者大会上大吹特吹这个功能,或许会给我们一些不同的惊喜。公平起见,提供给Gemini的问题做了一些修改,将“广州天河客运站”改为“纽约8大道”,“咸肉蛋黄粽”改成了“粽子”。

返回的结果如下:

在欧美一家独大,手握GoogleMaps等一众Android基础应用的谷歌,毫无疑问有着很大的优势,甚至可以直接从搜索结果调用GoogleMaps,进行导航等一系列操作。

考虑到百度也有百度地图等一系列业务,未来其实也可以整合到AI服务中,为用户提供一站式的AI搜索服务。不过想要获得更好的体验,估计还是需要打造一个集导航、生活服务等功能于一体的超级App,至少需要打破如今各自为战的局面,才能提供更好的AI搜索服务。

单纯从生活服务方面来看,目前的AI搜索都有着很大的局限性,至少在PC端的使用体验不尽如人意,对于个人而言,移动端或许才是生活类AI搜索的最佳归宿,借助移动设备的精准定位和应用数据,可以显著增强如位置信息、周边信息搜索的准确性。

不过,我们在搜索引擎的提问显然不会仅止于生活服务,更多的还是各种工作、生活中遇到的问题,那么在这些问题上,AI搜索的表现又如何呢?

在仔细考虑后,我选择从消费电子产品入手,看看AI搜索能否为我选购一款手机。

答:

简单搜索

小悟空

说实话,在此之前我并没有会是这个结果,从一位专业数码科技编辑的角度来看,除了Kimi之外,其余的AI都有着不错的表现,特别是在第一轮问题中“摆烂”的智谱清言,这次给出的回答却让我颇为惊喜。

先说结论,个人认为第一梯队是智谱清言、简单搜索(百度),第二梯队则是小悟空,360AI搜索只能算是勉强合格,Kimi则是不合格。

先看第一梯队的回答,智谱清言给出的推荐是:Mate60Pro+、vivoX100Pro和OPPOFindX7Ultra,简单搜索则是:Mate60Pro、P60Pro、OPPOFindX7Ultra和荣耀Magic6Pro。

除了P60Pro和Mate60Pro/Pro+这两款去年的产品外,其余都是今年的新锐旗舰,vivo和OPPO在影像拍摄上的表现确实满足了“拍照功能好一些”的要求,而在价格上,目前在售价都低于6000-8000元的档位(这AI还会帮我省钱?)。

图源:OPPO

至于Mate60Pro和P60Pro,虽然本身的影像实力并不算差,但是与今年的旗舰相比还是差距不小,让我好奇的是为何最新的华为P70系列没有在任何一个AI中被提及。

再来看看第二梯队唯一的独苗小悟空,与排名更低的360AI搜索、Kimi相比,小悟空赢在没有瞎推荐一些已经落后的机型,虽然回答是所有AI里最简略的,但是Mate60Pro和iPhone15Pro显然都符合我的要求。

而且其中有许多款手机都并非旗舰型号,首发价远低于6000元,比如FindX3,更高配的FindX3Pro首发价也只要5499元。再比如荣耀50,首发价肯定不超过3000元,因为这本就是荣耀针对中端市场打造的性价比产品,主打2000-3000元市场。

剩下的真我GT大师探索版和iQOO8Pro都是类似的问题,价格完全不符合提问中给出的预算区间,只有小米11Ultra和vivoX60Pro+的首发价是符合预算的。

即使在随后的追问中,Kimi也依然无法给出准确的答案。

直到我将提问精确到2024年,Kimi终于给出了还算能看的回答。

说实话,这个表现实在是比另外几家差太多了,以我平常使用Kimi的体验来说,这次的发挥实在是有失水准。

最后,还得再提一嘴360AI搜索,如果你用过这个搜索引擎,那么会发现在AI回答的底部还有一个“详细说说”的选项。

按常理推断,点击后应该是在原有的回答基础上,给出更详细的解答,比如为什么推荐这些产品、这些产品的特点是什么之类的。但是,360AI搜索却选择重新生成一篇回答,而且错的离谱。

不仅推荐的机型完全混乱,连价格都是全部出错,如果一加知道AcePro可以卖到7199元(首发价为3499元),怕是做梦都能笑醒。

考虑到这可能是偶然的BUG,于是我用第一个问题重新测试了一遍,发现整体表现还是优于普通模式下的回答的。

随后我尝试了数次的“详细说说”,发现每一次360AI搜索都会给出不一样的回答,答案的质量则是有好有坏,虽然看起来比普通模式更详细,但是回答的准确度反而降低了,360的工程师们还是需要再好好调教一下AI的详细模式,如果可以做到在原有的基础上进行扩展,体验会好很多。

虽然这一次的横评只提了两个问题,但是却涉及两个不同的领域,一个是针对线下生活的问题,另一个则是针对AI的理解与搜索能力的问题。

从第一个问题中可以看到,部分AI对于实际地点和部分词汇的理解会出现明显的问题,为了提高响应速度,对结果的筛选和整理都不尽如人意。同时也暴露出AI搜索的一个问题:难以从网页信息中分辨出带有迷惑性的数据,导致输出误导性的回答。

而Kimi等AI大模型则需要你提醒他选择最新的产品后,才能输出对应的回答。

随后我又测试了数个不同领域的问题,基本上文心一言的整体表现是最稳定的,在不同领域都能给出至少合格的回答,而其他AI搜索则时好时坏,偶尔还会“暴雷”。不得不说,百度在拥有多年的搜索引擎领域经验配合领先的AI技术,确实让其做到了目前国内当之无愧的第一。

而且,我使用的只是百度旗下的简单搜索,其调用的是文心一言3.5模型,而非更强大的文心一言4.0,不过这也说明在日常使用的时候,规模较小的文心一言3.5其实就可以满足需求,也让人对端侧部署AI大模型的日后表现变得更加期待。

在AI已经涌现出众多应用,谷歌、百度等企业开始推动AI搜索发展的当下,对于没有自主搜索引擎技术和庞大数据库的企业来说,他们的发展速度确实是比不上两大巨头,可以说他们本身的数据也要依托于巨头们的搜索引擎来获取,天生就受限于人。

在我看来,至少在AI搜索领域,未来可能还是谷歌与百度的天下,其他企业依然很难在这个领域取得比他们更好的成就。当然,作为一个仍处于探索阶段的前沿领域,这并非绝对的,我也希望有谷歌、百度之外的企业站出来,为我们提供更好的AI搜索体验。

不过在此之前,不管是谷歌还是百度以及其他的所有科技企业,都还需要继续精进AI的“数据打捞”技术。当前AI搜索最大的问题是:虽然可“一步到位”给出答案,但用户仍需去传统搜索引擎“验证”答案是否准确。也就是说,AI搜索的答案充满不确定性,未能100%准确,因此也就无法取代传统搜索。当AI搜索答案能做到100%准确可靠时,也就是取代传统搜索引擎之时。

2024年5月20日-6月30日,618年中大促来袭,淘宝天猫、京东、拼多多、抖音、快手、小红书六大电商平台集体“听劝”,取消预售、疯狂杀价!

THE END
1.百度AI技术实力排行分析AI百科人工智能(AI)已成为现代科技领域最受关注的焦点之一,各大科技公司都在积极布局和发展AI技术。作为国内领先的互联网巨头,百度在AI领域更是有着深厚的积累和突出的实力。本文将对百度AI技术实力进行全面分析,并对各子领域进行排名,以帮助读者深入了解百度在AI领域的综合实力。 https://heiti.cn/ai/27952.html
2.“超级有用”的AI,被百度做成了在能源电力行业,国家电网正在围绕文心大模型、千帆平台,结合电力行业高质量数据,联合百度共创电力行业大模型基础底座,并在调度、设备、营销等六大专业领域深入探索。目前,已经在电力设备运检、供电服务等电力行业核心场景成功完成应用落地。 得益于在全栈AI技术、产品创新和产业落地方面的持续投入,百度智能云拥有中国最广最http://ref-xmllq-hz1.ifeng.com/c/lenovo/8eTHRQYGRlb
3.人工智能[1611]百度AI:创造了人工智能的新高度随着科技的不断发展,人工智能已经成为了当今世界最为炙手可热的话题之一。作为全球领先的科技公司之一,百度一直在人工智能领域积极布局,不断推动着人工智能技术的发展和应用。近年来,百度在人工智能领域的成果已经引起了全球的广泛关注,尤其是百度AI的崛起,更是让人们对人工智能的未来充满了期待。 http://www.360doc.com/content/24/0221/12/30445705_1114710735.shtml
4.百度人工智能的技术处于什么水平百度无论在AI核心技术、战略、商业化等层面均已走在全球前沿。https://m.elecfans.com/article/960383.html
5.百度AI,终究在实战面前露了怯界面新闻·JMedia这是技术的问题还是基因的问题?对百度而言,新的、极简的、高效的、个性化的搜索服务,很可能会颠覆过去以竞价排名为主的盈利模式,在百度还没有找到AI商业化的成功模式前,这是其最不愿意看到的大变局。 十年“一梦”,百度的底色还是传统广告公司? 2014年,曾是百度的高光时刻,也是在这一年,百度围绕人工智能进行了大https://www.jiemian.com/article/12116678.html