一项新的研究探讨了人工智能能否成为创造性任务的自动帮手,结果喜忧参半:它似乎能帮助天生创造力较弱的人写出更多原创短篇小说,但却削弱了整个群体的创造力。随着人工智能工具对创造性工作的冲击,这种权衡可能会越来越普遍。
这项研究分别由伦敦大学学院的研究人员阿尼尔-多希(Anil Doshi)和埃克塞特大学的研究人员奥利弗-豪瑟(Oliver Hauser)完成,发表在《科学进展》(Science Advances)上。虽然这项研究由于侧重于短篇小说而存在一定的局限性,但它似乎证实了许多人所表达的观点:人工智能可以有所帮助,但最终在创造性工作方面并没有提供什么真正的新东西。
豪瑟在一封电子邮件中表示:"我们的研究代表了对大型语言模型和生成式人工智能将如何影响人类活动(包括创造力)这一重大问题的早期看法。虽然这项技术有巨大的潜力(毫无疑问,也有巨大的炒作)对媒体和更广泛的创造力产生巨大影响,但重要的是,要对人工智能进行实际的严格评估--而不仅仅是在假设它会产生积极结果的前提下广泛实施。"
该实验让数百人写非常短的故事(八句话左右),题材不限,但适合广大读者。其中一组人只是写作;第二组人有机会查阅 GPT-4,以获得几个句子的单一故事构思(他们可以根据自己的喜好使用或多或少的构思);第三组人最多可以获得五个这样的故事开头。
故事写好后,由故事作者和对人工智能生成转折一无所知的第二组人对故事进行评估。这些人根据故事的新颖性、实用性(即发表的可能性)和情感愉悦度对故事进行评分。
在写故事之前,参与者还完成了一项文字创作任务,作为创造力的替代指标。这是一个无法直接测量的概念,但在这种情况下,一个人的写作创造力至少可以被近似地估算出来(在此不做评判!不是每个人都是天生的作家,也不是每个人都是训练有素的作家)。
豪瑟写道:"用任何测量方法来捕捉像创造力这样丰富而复杂的东西似乎都充满了复杂性。然而,围绕人类创造力有一系列丰富的研究,人们也在热烈讨论如何最好地用一种测量方法来捕捉创造力的概念。"
他们的方法在学术界得到了广泛应用,并在其他研究中得到了充分证明。研究人员发现,创造力指标较低的人在故事评估中得分最低,这可以说验证了这种方法。当有机会使用生成的故事创意时,他们的收益也最大(值得注意的是,整个实验中绝大多数人都使用了生成的创意)。
创造力得分较低的人写出的故事在写作质量、可欣赏性和新颖性方面的评分均低于其他人。如果给他们一个人工智能生成的创意,他们在每个指标上的得分都会更高。如果让他们选择五个,他们的得分会更高。
对于那些在写作的创意方面苦苦挣扎的人(至少在这种语境和定义下)来说,人工智能助手似乎真的在提高他们的工作质量。这可能会引起许多人的共鸣,对他们来说,写作并不是一件自然而然的事,而一个语言模型说"嘿,试试这个",正是他们完成一个段落或开始一个新章节所需要的提示。
但是那些在创造力指标上得分很高的人呢?他们的写作攀上了新的高峰吗?很遗憾,并没有。事实上,这些参与者几乎没有得到任何好处,甚至(虽然非常接近,但可以说并不明显)得到了更差的评分。看来,那些有创造力的人在没有人工智能帮助的情况下也能写出最好的作品。
我们可以想象出造成这种情况的各种原因,但数字确实表明,在这种情况下,人工智能对具有先天创造力的作家的影响是零,甚至是负面的。
但这并不是研究人员担心的部分。
除了参与者对故事的主观评价外,研究人员还进行了一些自己的分析。他们使用 OpenAI 的嵌入式应用程序接口(embeddings API)来评定每个故事与同类其他故事(即纯人工智能、一个人工智能选项或五个人工智能选项)的相似程度。
他们发现,使用生成式人工智能会使生成的故事更接近其类别的平均水平。换句话说,作为一个群体,它们的相似性更高,差异性更小。总的差异在9%到10%之间,所以并不是说这些故事都是彼此的克隆。谁知道呢,但这种相似性可能是实践经验较少的作家完成了一个建议的故事,而创造力较强的作家则从头开始构思一个故事。
尽管如此,这一结论仍值得在结论中加以警示,全文引用如下:
虽然这些结果表明个人创造力有所提高,但也存在集体新颖性丧失的风险。在一般平衡状态下,一个有趣的问题是,人工智能所增强和启发的故事是否能够在其产出中产生足够的变化。具体来说,如果出版业(和自助出版业)接受了更多由人工智能启发的生成故事,我们的研究结果表明,所产生的故事总体上将变得不再那么独特,而是更加相似。这种螺旋式下降的现象与一种新出现的社会困境相似:如果单个作家发现自己受人工智能启发创作的作品被评价为更具创造性,他们就有动力在未来更多地使用人工智能,但这样做可能会进一步降低故事的整体新颖性。总之,我们的研究结果表明,尽管生成式人工智能对个人创造力有提升作用,但如果生成式人工智能被更广泛地应用于创造性任务,则可能需要警惕。
这与视觉艺术和网络内容中的担忧不谋而合,即如果人工智能导致更多的人工智能,而它所训练的只是更多的自身,那么它最终可能会陷入自我循环的平淡无奇之中。随着人工智能生成技术开始悄然进入各种媒体,正是这些研究对那些宣称创造力无限或人工智能生成电影和歌曲的新时代的说法起到了制衡作用。
豪瑟和多希承认,他们的工作才刚刚开始--这个领域是全新的,每项研究,包括他们自己的研究,都是有限的。
"我们期待未来的研究能够走上一些道路。例如,'野生'生成式人工智能的实施将与我们的受控环境截然不同,"豪瑟写道。"理想情况下,我们的研究既有助于指导技术,也有助于指导我们如何与技术互动,以确保创造性想法的持续多样性,无论是在写作、艺术还是音乐方面。"