与此同时,文心一言上线深度搜索功能,OpenAI一周前紧急开直播将推理大模型思考能力用于联网搜索,还没捂热乎,百度接着 给 我 破~
卷,大模型现在也太卷了吧。
据了解,最新深度搜索功能,“推理模型+搜索”直接将复杂问题问答查询拉至专业级,具备更强的思考规划和使用工具的能力,同样4月1日起免费开放使用。
量子位童鞋第一时间上手体验了一波。
每次搜索时,它会灵活规划调用代码解释器、高级联网、AI绘图等各种工具,并附带思考和行动过程,最终形成一个高质量多模态输出,有表格、图片、代码的那种。
比如,针对马上票房破百亿的《哪吒2》,你可以随便将各种你想问的问题一连串发给它,无需一个一个地问:
哪吒2为何如此受欢迎?为什么说敖丙是个橙子?帮我生成一个大橙子漂在海面上的图。就“为什么敖丙一家子颜值都很高,但北海和南海龙王相貌奇怪”做分析
秒秒钟它就能完成思考规划,然后分别对每个问题作答,一连串问题一个不漏都能回答对:
敖丙是敖闰侄(orange)这样的梗也能理解。
话不多说,接下来继续深入了解一下~
最新深度搜索功能一手实测
文心一言深度搜索的打开方式是这样婶儿的:
和普通AI搜索大有不同,深度搜索主打的是提供专家级的复杂问题问答查询服务,针对专业咨询类问题进行了加强。
其回答过程是先对用户核心需求进行分析将问题划分步骤,然后调用工具进行搜索思考整理,最后思考完成输出结果。
深度搜索,多模态输出
先来点小菜开开胃~
接开头,一个哪吒站起来了,自然而然会想:还有哪些中国神话故事适合改编成动画?
普通AI搜索一听到“中国神话”,这时可能就要把盘古、女娲、伏羲、神农等给搬出来了。
深度搜索一开始也确实通过联网搜索工具搬了一堆,belike:牛郎织女、女娲造人、盘古开天、嫦娥奔月、大禹治水、伏羲画卦、后羿射日……
不过在此过后,深度搜索还多了一步思考和分析的过程,于是乎“一发入魂”:
考虑到用户提到最近哪吒2爆火,说明哪吒这一人物形象深受观众喜爱,因此,我选择与哪吒相关性强且情节丰富、人物性格鲜明的故事——《大闹天宫》。
不得不说,选在了大伙儿的心趴上~~
再来点复杂的,查一下封神榜诸神谱系
深度搜索从被封的第一个神(三界首领八部清福正神 柏鉴)起,将365路正神扒了底朝天。
接着还可以对部分人物成长历程按时间线进行整理,写一份分析报告。
更亮眼的是,如果你觉得这样的查询结果分析起来还是不明了,还可以让它根据从网上搜来的信息,划分主要神祇的层级关系。
画图表、列表格都不在话下。
有了这样的工具加持,以后再做分析报告整理素材就简单多了。
而且其联网搜索还是实时的,可以紧跟最新消息和热点,询问天气啥的也都行:
多工具,灵活调用
针对工具规划及调用能力的提升,文心一言深度搜索还能够分析民生、创业、经济等更加专业的复杂问题
深度搜索可调用的工具包括高级联网、代码解释器、文档问答、图片理解、AI绘图、词云生成等,支持上传文档和图片
比如你想了解瑞幸咖啡最近的经营情况,就可以上传手头里有的资料,让它结合起来分析:
深度思考会结合用户上传的资料自动规划,如果报告中缺少某些资料也会提醒自己接下来要用高级联网查询:
思考过程中,如果有画图表等需求,它就会自动启用代码解释器进行绘制:
最后给出一份图文并茂的综合性调研:
像下面这种查询,深度搜索也能帮上忙:
想在北京开一家宠物友好的咖啡馆,预算50万。请帮我:1)分析周边3km竞品情况;2)计算预期成本和收益;3)列出所需证照清单;4)设计一份特色菜单
它会挨个逐步解决每个小问题,一次高级联网解决一个小问题后,再启用高级联网获取下一个,条理清晰。
思考过程细节满满,成本估算中也会标明地段、装修、设备配置等是按照何等标准进行估算的。
另外,还可以上传图片让它结合网络信息解读,梗图也能看懂。
最最最后,马上就要情人节了,送男/女朋友什么礼物好呢?
帮忙编写一个爱心小程序吧~
大模型里最懂搜索,搜索里最懂大模型
一番体验下来,文心一言的深度搜索确实让人眼前一亮。
毕竟,百度靠搜索起家,在中文互联网领域具有深厚积累。
从技术上来说,百度一大优势就是其RAG技术。
结合了语言模型和信息检索,百度RAG具备中文深度理解、多模态检索、垂直领域定制化以及实时数据整合能力等优势,尤其是在中文互联网、企业服务等场景中。
此外,其研发的“理解-检索-生成”协同优化的检索增强技术,将回答问题的过程拆分成了三个阶段,大幅提升了大模型技术及应用效果。
从去年年初开始,百度还在重点攻克iRAG技术。
iRAG,即Image-based Retrieval-Augmented Generation,是一种结合检索和生成的技术方法,专门应对图像生成的幻觉问题,可以提升生成内容的可靠性和准确性。
其核心是将百度搜索的亿级图片资源与文心大模型的生成能力相结合,通过联合优化,让生成图片更加真实可信。
在影视作品、漫画作品、连续画本、海报制作等多领域,iRAG都有广泛的应用空间,可帮助用户大幅降低创作成本。
而深度搜索,正是将这些技术能力囊括其中。
话说回来,百度这波免费操作,着实来得太突然。
大手一挥,最强模型全民也皆可免费使用了,着实在Open的路上迈出了一大步。
据了解,这背后其实是文心一言训练和推理成本的双双降低。
最近李彦宏在公开场合表示:
在过去,当我们谈论摩尔定律时,每18个月,性能翻倍、成本减半。但是今天,当我们谈论大语言模型时,12个月推理成本就能降低90%以上。
为何能做到如此突破?不妨盘盘百度的杀手锏:
训练方面,百度有高性价比昆仑芯的加持,能够在更少的计算资源下运行大规模模型,直接降低单位算力成本。
百度智能云还有万卡大规模集群,据悉计划扩展至3万卡。大规模集群可以通过任务并行调度、弹性算力管理等方式,提高计算资源利用率,避免算力闲置,整体算力成本再降一截。
除此之外,百度还有百舸平台助力,百舸提供全面的故障诊断手段,以保大规模集群执行训练任务的稳定性。
推理方面,百度尤其还有飞桨深度学习框架的支持,其中并行推理、量化推理等都是飞桨在大模型推理上的自研技术,推理成本也被打下来了。
目前,文心一言使用情况根据公开资料显示,截至2024年11月,用户规模为4.3亿,文心大模型日均调用量超过15亿次,较2023年增长超30倍。
那么问题又来了,百度下一步要做什么?
CNBC引述知情人士爆料称,百度计划在今年下半年发布下一代人工智能模型Ernie 5.0,将在模型多模态能力方面有重大增强。
结合奥特曼剧透GPT-5也要来了,如此来看,2025年下半年,基座模型“5.0竞赛” 就要来了。