文心一言通义千问们互评高考作文友商们快打起来了

又是一年高考时，随着第一科语文考试结束，全国高考作文题目再度成为全网热议。一年前的今天，大模型风口渐起，除了照例有各路大V、达人在朋友圈、微博等社交平台展开作文大赛之外，ChatGPT、文心一言、讯飞星火三款头部大模型也被“请来”作答高考作文。

而在2024年，百花齐放的国产大模型已在性能和体验上不输GPT-4，使用更多中文语料的训练也让这些本土玩家普遍“更懂中文”。

于是，AI蓝媒汇以新课标I卷作文题为例，分别测评了BAT三家传统大厂，以及科大讯飞、月之暗面、百川智能三位热门选手的共计六款主流大模型，还引入了大模型互评环节。

谁考得最好，谁没发挥好，拭目以待。

· 新课标I卷作文题目：

阅读下面的材料，根据要求写作。（60分）

随着互联网的普及、人工智能的应用，越来越多的问题能很快得到答案。那么，我们的问题是否会越来越少？

以上材料引发了你怎样的联想和思考？请写一篇文章。

要求：选准角度，确定立意，明确文体，自拟标题；不要套作，不得抄袭；不得泄露个人信息；不少于800字。

· 百度文心一言4.0：

其余五款大模型打分如下：

综合得分：55.8

· 阿里云通义千问2.5：

其余五款大模型打分如下：

综合得分：56.8

附：文心一言给出满分的原因

· 腾讯元宝：

其余五款大模型打分如下：

综合得分：58.2

附：文心一言给出满分的原因

· 科大讯飞讯飞星火：

其余五款大模型打分如下：

综合得分：57.2

· 月之暗面 Kimi：

其余五款大模型打分如下：

综合得分：55.2

附：讯飞星火给出低分的原因

· 百川智能百小应：

其余五款大模型打分如下：

综合得分：56

从测试以及评分结果来看，在所有六款大模型之中，文心一言综合打分最高，给友商文章平均打出了58的高分。其中还有两次给了满分。

而讯飞星火打分最低，给友商文章平均只给出了53.2的分数。

那么，这些作文，你给多少分？

对文章打分

文心一言通义千问们互评高考作文友商们快打起来了

最新资讯

编辑精选

热门评论

相关文章

OpenAI年薪仅6.5万美元奥特曼却掌控28亿美元创业帝国

OpenAI发表研究论文介绍了一种逆向工程AI模型工作原理的方法

苹果与OpenAI奥特曼合作在AI领域迎头赶上

美国财长耶伦：在金融体系中采用人工智能或带来“重大风险”

Stability AI 发布用于生成声音和歌曲的开放式AI模型

Top 10

美国暂停T86清关三个月 Temu与Shein影响多少？

NVIDIA CEO黄仁勋在访问台北街头时称台湾为最重要的国家之一

新加坡港遭遇史诗级“大堵船” 全球运价集体飙升

中文互联网正在加速崩塌

加微信好友是我扫你还是你扫我微信：这里大有学问

消息称中芯国际成功开发出5纳米DUV工艺华为Mate 70系列可能成为首批受益者

对文章打分

文心一言通义千问们互评高考作文 友商们快打起来了

最新资讯

编辑精选

热门评论

相关文章

Top 10

文心一言通义千问们互评高考作文友商们快打起来了