X公司(推特)日前更新了服务条款,在未经许可的前提下,任何第三方都不得在X平台上抓取数据来培训人工智能(AI)模型。该条款将于9月29日起生效。根据新条款,未经事先书面许可,无论出于何种目的,都不得在X平台上进行任何形式的数据抓取行为。而之前,X公司允许外界通过robots.txt文件对平台数据进行抓取。
robots.txt文件可向机器人爬虫提供指令,告诉它们可以访问网站的哪些部分。但在过去的几个月里,X公司修改了robots.txt文件,删除了除谷歌以外的所有爬虫机器人指令。2015年,X公司与谷歌达成了一项协议,允许谷歌在搜索结果中显示推文。
X公司老板埃隆·马斯克(Elon Musk)一直反对第三方收集X平台上的数据来培训人工智能模型。今年4月,他甚至威胁要起诉微软,称微软非法使用X的数据训练其人工智能模型。
7月,X公司对四家实体提起诉讼,指控它们从事数据抓取活动,导致X的服务器严重紧张,用户体验恶化。X当时称:“抓取会干扰网站和移动App的合法运营,因为它发出了数百万个请求,对服务器带来很大负载,并损害了真正用户的体验。“
在禁止第三方抓取的同时,X本月早些时候也曾调整隐私政策,允许X使用用户发布的信息来训练其人工智能模型。马斯克称,X只会使用公开的信息来训其练人工智能模型,不会使用任何私有的内容。