主流新闻机构正在采取截然相反的做法,让自己的业务免受人工智能的威胁--有些选择与人工智能公司合作,有些则起诉它们。与音乐和图书出版商不同,新闻机构在争取版权保护的斗争中很难统一战线,这可能会削弱他们与大科技公司谈判内容许可的筹码。
新闻动态本周早些时候,八家著名的美国地区性报纸与《纽约时报》和其他新闻机构一起起诉ChatGPT 母公司 OpenAI 和微软侵犯版权。新的诉讼为《纽约时报》的主张增添了砝码。到目前为止,《纽约时报》是唯一一家对人工智能公司的版权侵权行为采取法律行动的大报。The Intercept、Raw Story 和 AlterNet 等较小或较新的媒体也起诉了 OpenAI 和微软。
其他几家大型新闻出版商,包括《金融时报》、美联社和阿克塞尔-施普林格(Axel Springer)则选择与人工智能公司达成价值每年数百万美元的有偿协议,从而削弱了《纽约时报》关于其应获得数十亿美元损害赔偿的论点。该地区报纸的诉讼与《纽约时报》的诉讼在同一地区提起。如果选择同一位法官来监督这两起案件,诉讼双方可以选择将两起申诉合并。
《纽约时报》在诉讼中拥有一定的筹码,因为被起诉的公司数月来一直在积极尝试与该报达成交易。
本周起诉 OpenAI 和微软的八家报纸以及许多其他新闻公司,根本没有与这些人工智能公司积极讨论过许可协议。人工智能公司可能不需要从每家出版商那里获得新闻内容许可,这取决于他们需要训练或为其大型语言模型提供信息的内容类型和数量。
ChatGPT 开发商 OpenAI 这样的人工智能开发商通常不会分享他们在训练模型时使用的内容细节。在大多数情况下,他们只是说自己在合理使用"可公开获得的"数据。但许多出版商认为,他们正在派出爬虫,采集本应由他们付费的受版权保护的资料。
在数字时代,新闻机构沿着不同的道路发展,使得许多新闻编辑室在与人工智能公司谈判时,目标相互冲突:
以广告为基础的新闻企业依赖于通过搜索发送的访客,他们担心科技公司会利用他们的内容来完善基于人工智能的服务,而这些服务只会为用户提供信息,却不会发送流量。
像美联社这样的授权企业,与人工智能公司达成交易的损失较小,因为它们的大部分收入已经来自于提供内容访问权的交易。
对于希望训练大型语言模型的人工智能公司来说,拥有数十年内容的老牌新闻公司的档案可能非常有价值,而发布大量新闻的新公司则可以帮助人工智能提供商提供实时数据和见解。
拥有大量视频档案的新闻出版商(如广播公司和有线电视网络)比基于文本的企业略胜一筹,因为视频档案通常不太容易被机器人抓取。
目前,出版商很难找到与人工智能公司合作的最有利可图的方式,因为没有市场帮助买卖双方就费率达成一致。一些出版商正寻求与TollBit 等公司合作,TollBit 正在建立一个市场,将人工智能机器人和搜刮工具与出版商经过验证的内容连接起来,并收取动态费用。福克斯公司正在利用区块链技术建立一个类似的市场工具,以帮助出版商跟踪其内容何时被采集,从而更好地与人工智能公司进行谈判。为了规避风险,美联社在与 OpenAI签订的许可协议中规定,如果未来有其他出版商与 OpenAI 达成更好的协议,美联社有权重新设定赔付条款。
在新闻行业分头行动的同时,科技公司并没有等待支付条款的谈判,无论是在法庭上还是在市场上--他们已经着手获取他们需要的数据。