不知道大家还记不记得, AI 大模型刚登场的时候,很多人都说这玩意和搜索引擎到底有啥区别啊。结果就是接入了 Bingchat 的 New Bing ,风头一度盖过了绝对垄断的谷歌,赚足了大家的关注度。不瞒大家说,我其实已经快半放弃传统搜索了。
因为传统搜索的效率,和 AI 搜索一比,着实低了太多。
图片 传统搜索都是关键词检索,要求给出的词语要百分百精准,才能找到对的信息。更何况,还有各种高位广告和推广,在混淆视听。
所以稍微留意一下,会发现百度、 360 等各家,都在尝试接入 AI 。
而作为 AI 赛道的老玩家,昆仑万维也有了新的动作。就在昨天,昆仑万维基于自研大模型正式发布了天工 AI 搜索。
这里也不跟大家卖关子了,差评君比大家稍微提前几天,拿到了内测的资格。
不过,也别眼馋,这次大家都有机会用到,文章最后就有天工的内测申请入口,提交手机号,就可以申请。
但是,在大家去试手前,也可以跟着差评君这个大模型老手,先来探探水。
在几天的深度体验之后,我最大的感觉就是天工AI 搜索非常完整和成熟。
即使在各种AI 应用已经试麻了的情况下,依然让我眼前一亮。
首先,最惊艳我的就是天工 AI 搜索的自然语言交流功能,完全可以通过自然流畅的对话式交互就能够精准地识别出你的搜索意图。
更重要的是,它有着传统搜索引擎不具备的整合信息和提炼资料的能力。
传统搜索只会提供海量“ 信息 ”,但大模型使得 AI 搜索具备整合、提炼、串联信息的能力,可以更好地应对开放式问题,尤其是知识以及创意类问题,表现会远胜于传统搜索。
大家看看下面这个例子,就能明显感觉到差别了。
传统搜索引擎
天工 AI 搜索
而且为了让你用起来更加顺手,它的各项功能适配得也很不错。
作为联网的 AI 搜索,它把回答时引用的资料,全整理在回答顶部的参考栏里,各种来源一目了然。点击这些来源,就可以直接跳转。
你也可以从想了解的某句话跳转,每一句回答后面,都会用小标标注出来源。
这样细致的来源标注,能大大提高信息获取效率,也能方便我们核对回答的准确性。
基于大模型的连续对话能力,如果对现有的回答不满意,我们还可以进一步追问。问过的所有问题,都会整理进【 我的历史 】里,方便回看。
当然了,我说天工的表现眼前一亮,肯定不止界面和功能。
所以,大致了解基本功能之后,还是得把重头戏落到正式测试上。
这次就不整那些弱智吧的逻辑题,因为那些题已经有点落伍了。现在的关注点,更多的是盯在谁家的大模型应用,最能解放人力。
图片 所以,今天我们从实时性、连续对话、信息真实性,三个我觉得决定 AI 搜索实用能力的重点项目,来做一个测试。
这第一题,肯定就先从联网实时性考起。
因为测试这题的时候,刚好是 8 月 22 号七夕节。
如果那天无所事事,甚至还在高强度冲浪的差友,肯定记得这个梗 #建议大家七夕的时候,把微信步数关一下# ,这会暴露你节日那天无人约。。
虽然是个新鲜出炉的新梗,不过天工轻松驾驭。
甚至不仅仅回答了为什么,还附带回答了后续微信的官方回应。最后,还贴心地给有需要的朋友,附上了一份如何关闭微信步数的教程。
看来这第一题,天工算是高分通过了。
咱们再来测下一道,连续对话能力。
差评君也选了最近互联网大热的室温超导话题,并且,为了验证它是不是能读懂前后文,追问的时候,故意用的是模糊的主语。
紧紧追在天工屁股后面连问了三轮,天工都能稳定发挥。
准确地知道提问中的模糊主语,指代的是 LK-99 这个材料。并根据你的提问,给出进一步的答案。
不过,让人有点出乎意料的是,差评君把同样的问题,丢给了 New Bing 。
它居然在第一个追问的时候,就败下阵来了。。
从前两项的表现,不难看出来天工的基本功是相当扎实。
不仅仅基本功到位,最重要的是它给你的答案,可以保证准确度。
图片熟悉 AI 的朋友,肯定都知道胡言乱语是大模型的老毛病了。要想把 AI 搜索真正用到工作里,比起什么连续对话和实时性,答案的准确度才是优先考虑项。
所以,最后的测验里,差评君特地挖了一个坑,问了一个根本不存在的数据:抖音 2010 年的用户数。
天工的表现并没有拉胯下来,非常清楚地指出 2010 年压根抖音都还没上线。
有大量的网上资料作为信息补充
大大改善了大模型胡言乱语的毛病
三轮测试下来,天工完满通过,在每一轮都表现得相当亮眼,让差评君挑不出什么刺儿来。
不过,不服输的差评君,后续又加码测试了很多题目,也抓到了天工的瑕疵。
在强实时性的信息搜索的时候,比如地图、天气等等,回答的还不够完善。好在这一点瑕不掩瑜,目前大部分的 AI 搜索,其实在这方面都还不太行。
总体来看,天工 AI 搜索已经是非常成熟和完备了。不仅是处理信息和沟通方面表现不错,在此基础上,还能进一步地保证信息的准确度和及时性。
如果和传统的搜索引擎一比,优势就更加明显了。举个最简单的例子,如果你想知道一个非常细节的问题。
比如最近各家本地生活业务,撕得是头破血流。那么在这其中,快手到底是从谁开始发力搞本地生活的?
如果直接冲到传统搜索引擎里,按照关键词搜索,会发现根本找不到你想要的资料。
但是,问题抛给能读懂你意思的天工,一切就简单很多了。
你不需要再从繁杂的搜索结果里,眯起眼睛找答案。有大模型的底子,天工能迅速读懂你的意思。
你问什么问题,天工就告诉你对应的答案。并且,还附赠一份它消化和整理好的资料。
你甚至还能就这个细节再继续深入追问,天工支持 20 多轮次以上的对话,能让我们放心地处理复杂的难题。
与此同时,天工基本所有的引用文章,都来自相对官方的平台。
而且,根据你提问的领域不同,天工引用的平台来源也会变化。比如科技互联网相关问题,更多的就是来自于 IT 之家、 199it 等平台。
但是,到了传统搜索引擎这边,除了只能把搜索资料,一股脑地甩到你脸上之外。。
一旦你的提问涉及到的相关资料比较少,为了能够优先对上关键词,搜索引擎就不得不推送一些犄角旮旯里的资料给你,里面很可能就夹杂着错误消息。
随便问个不存在的数据,传统搜索就中招了。
看到这,你应该能非常直观地感受到,传统搜索引擎是怎么被 AI 搜索碾压的。
而且,依托于大模型的底子,天工也能根据你的提问,直接生成文档、图表、方案等等。完成从知识搜索到内容生产的一步到位,帮你狠狠解放人力。
目前展示的这些,还不是天工 AI 搜索的最终形态。天工的多模态的上传能力还在测试阶段,不久后就会支持声音、图片等信息的处理。
不过,就靠现在扎实的文字检索能力,差评君觉得天工 AI 搜索也能跻身 AI 应用赛道的实力坑位。
如果大家有兴趣,可以点击链接 tiangong.cn,申请到天工的内测。差评君觉得还是值得一试的,因为未来传统搜索,一定会慢慢地向 AI 搜索靠拢。
原因非常简单,追求高效率是我们发展路上一个永恒谈论的话题。
大家都希望高效地完成工作,减少无意义的消耗。让更多的时间,用在更重要的人和事情上。