维基百科的参考资料非常关键,即支持在线百科全书中信息的来源链接。但有时,这些参考资料是有缺陷的,例如指向损坏的网站、错误的信息或非可信的来源。10月19日发表在《自然-机器智能》(Nature Machine Intelligence) 上的一项研究表明,人工智能(AI)可以帮助清理维基百科条目中不准确或不完整的参考文献列表,提高其质量和可靠性。
总部位于伦敦的Samaya AI公司的法比奥-佩特罗尼和他的同事们开发了一个由神经网络驱动的系统,名为"SIDE",它可以分析维基百科的参考文献是否支持与之相关的说法,并为那些不支持的参考文献提出更好的替代方案。
"鉴于 ChatGPT 对引文的错误和幻觉是出了名的,用人工智能来帮助处理引文似乎有点讽刺。"马萨诸塞州沃尔瑟姆本特利大学研究人工智能的诺亚-吉安西拉库萨(Noah Giansiracusa)说:"但重要的是要记住,人工智能语言模型的作用远不止聊天机器人。"
SIDE 经过训练,可以利用维基百科现有的特色文章识别出好的参考文献,这些文章在网站上得到推广,并受到编辑和版主的广泛关注。然后,它就能通过验证系统识别出页面中存在劣质参考文献的声明。它还可以扫描互联网,查找有信誉的来源,并排列出替换不良引用的选项。
为了对该系统进行测试,Petroni 和他的同事使用 SIDE 为维基百科的特色文章推荐它以前从未见过的参考文献。在近50%的情况下,SIDE的首选参考文献已经在文章中被引用。在其他情况下,它找到了其他参考文献。
当向一组维基百科测试用户展示 SIDE 的结果时,21% 的用户更喜欢人工智能找到的参考文献,10% 的用户更喜欢现有的参考文献,39% 的用户没有偏好。
瑞士苏黎世大学计算通信科学家亚历山大-乌尔曼(Aleksandra Urman)说,该工具可以为编辑和版主检查维基百科条目的准确性节省时间,但前提是必须正确使用。她说:"该系统在标记那些可能不合适的引文方面可能很有用。但问题是,维基百科社区会认为什么最有用。"
乌尔曼指出,测试 SIDE 系统的维基百科用户对两种引文都不喜欢的可能性是对人工智能推荐引文喜欢的两倍。她说:"这意味着,在这种情况下,他们仍然会上网搜索相关的引文。"