随着人工智能技术的飞速发展,AI写作能力逐渐受到关注。高考作文作为衡量学生语言表达、思维逻辑和文化素养的重要标准,自然成为了各大人工智能模型测试和对比的理想题材。让不同的AI模型参与高考作文的写作,我们不仅可以检验它们在自然语言处理方面的能力,还能比较它们在内容创意、逻辑构建和语言运用等方面的表现。
本篇文章将深入探讨各大AI模型在高考作文写作中的表现,以期揭示AI写作能力的现状和未来潜力。
老师一再强调:“题好一半文,龙头配凤尾,猪肚有血肉,文采满篇飞”呀,同学们。
AI 押题
在高考前,我们上传了广东2009年到2023年高考作文题集合,让kimi、豆包、通义千问、文心一言、智谱清言、腾讯元宝AI以及gpt4o结合出题逻辑和社会时事推测3个选题。高考广东新课标卷为人工智能,即AI压中选定试卷选题方向。今晚还会快马加鞭压理综大题,欢迎加微信aitechreview一起唠嗑。
根据近年高考试卷改革,广东16年以后用的是新课标1卷,因此在此选择考卷为是广东高考语文题目,所以在细范围内AI的推测更精准。
作文押题年年有,今年用 AI 押题,出其的统一,并且精准命中。
继让AI押题高考作文获得了极高的准确率,我们继续让AI参与本次高考的作文写作。
1
ChatGPT 4
在中文领域方面,ChatGPT一直没有特别亮眼的地方,比如在作文写作上,甚至没有一个醒目的标题。
2
Claude 3
在学术内容上,Claude一直表现的比较出众,这篇作文,似乎有可能会在老师的眼里获得高分。
3
豆包
豆包的文笔有真人写作的味道了,但内容总是让人“似曾相识”,可能是语料问题,比如这次写出来的立意也有点像洗稿。
4
元宝
元宝是2024年性能上的黑马,只能说不愧是鹅厂的,上限我们不敢说,但是性能实力是保底的。不过这篇作文太互联网了,不必那么给自己打鸡血的。
5
通义千问
这里的每大段的“首先、其次、再者”......或许 AI 有自己眼中“龙头猪肚凤尾” 。
6
文心一言
文心一言的写作是唯二我读了三遍的,因为它写的东西我挑不出什么毛病,但同时也说不上有什么好,或许这就是AI 的“可靠”之处,它可以没有什么创新,但真的挑不出什么错误。
7
智谱清言
毕竟是清华系的,不知道这篇作文如果真的参加了打分,最后能不能考上清华。这篇文章的“首先、其次、再次、最后、综上所述”,不知是否就是现在最标准的获分方式。
8
天工
天工哪怕开卷考也被取消了考试资格,引导了半天只有“全网搜索”这个能力,对此保留一切评论。
9
Kimi
作为目前社会上文书工作排名第一的Kimi,整理文字是一把好手,纯写作方面也是可圈可点,也是走了一回“首先、其次、再者、最后、综上所述”的手法。
10
讯飞星火
讯飞星火这次的表现超过了以往的平均分数,在没有更多引导的情况下,给出了思考和反省的环节。但毕竟仍局限在AI的训练内容,写出来的还是以往文章的观点。但基于“记忆力无穷”的优势,讯飞把这些观点糅合的书写了出来。
11
跃问
就和大部分老师高考阅卷一样,越看到最后,越觉得AI的写作没有什么出彩的地方,但这更符合现实。
跃问的答卷也是一则高分答案,但所有AI一遍又一遍的“首先、其次”,已经让人类反应过来了,人或者机器在写作时,都会受到“规则”的影响,创作,的确不是一件容易的事。
12
百小应
百小应所写的内容说不上是最出彩的,但它理解了“让它写作文”这件事,给了一个标准的书名号标题,在内容中,与大部分优秀答案一样,加入了思考,引入了话题。
或许创作这件事,在现在的互联网社会中,已经很难分清是“问题有没有变少,答案是否真的越来越多”。
AI写出的,或许不是作文
虽然通过对比不同AI模型在高考作文中的表现,我们可以清晰地看到每种模型的优势,但同时也看到了并不是每个AI都是以万能为前提进行开发训练的。它们有缺陷,它们有优势,它们目前仍然是需要人类自身去利用才能显现出价值的工具
目前的AI写作还存在大量的不足。当然,我们也相信在不久的将来,随着技术的进步,AI将能够在写作上、乃至更多的领域展现出更加出色的能力。
尽管AI能用,但这不是我们完全依赖他们的理由。