国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

随着今年高考的结束，一场前所未有的“智能竞赛”也在幕后悄然展开。今年的高考战场上，一支非传统但引人注目的队伍——国产人工智能大模型，吸引了广泛关注。近日，搜狐科技、量子位等十余家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的全面评测，并公布了令人瞩目的成绩。

首先进行的是高考作文的评测。在搜狐科技的评测中，三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列，智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。

而在潇湘晨报的“AI写作”评测中，讯飞星火不仅平均分位居首位，且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师，对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分，经过四位阅卷老师的综合打分，讯飞星火以49分的平均分高居首位。

给讯飞星火打出“全场最高分”56分的阅卷老师表示：“本文观点清晰，论述集中且层层推进，很多句子都简洁有力，颇有思想性。如果是某个学生写的，无疑是难得的佳作。”

接下来是数学科目的较量。在搜狐科技的数学评测中，讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队，智谱清言、阿里通义则以50%的正确率位居第二梯队，其他大模型相对落后。

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

在量子位的高考数学评测中，虽然没有给出详细成绩单，但展示了各家大模型详细的解题思路，交由网友打分，通过网友的投票打分可以看出，讯飞星火的“识图+解数学题”能力收到了最高认可，位居其后的分别是Kimi、通义千问、文心一言、豆包等。

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

最后是高考物理的测试。在量子位的评测中，阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队，而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。

文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题，在成功识别的题目中，商量和文心一言的正确率为2/4，即正确率为28.6%；豆包、天工、智谱清言正确率为1/2，即正确率为14.3%。

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

综合以上媒体在作文、数学、物理三门科目的成绩，我们得出了2024年人工智能大模型高考“成绩单”。来自科大讯飞的讯飞星火以52.49分高居第一名，通义千问、文心一言分别位列第二、第三名，而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。

综合成绩：

第一名：52.49 讯飞星火

第二名：46.08 通义千问

第三名：37.67 文心一言

第四名：34.68 Kimi

第五名：33.57 字节豆包

第六名：31.92 海螺AI

第七名：30.61 腾讯元宝

第八名：30.28 智谱清言

第九名：21.56 百川百小应

对文章打分

国产AI大模型高考成绩单出炉：讯飞星火获得综合第一

最新资讯

编辑精选

热门评论

相关文章

又一家AI机器人公司Dexterity获得大笔融资

欧洲银行纷纷尝试DeepSeek

OpenAI推出新工具Responses API 帮助开发人员构建人工智能代理

马克·库班称AI"永远不是答案" 只是一种"工具"

Manus邀请码炒到千万元“天价” 多位卖家：都是骗人的

Meta开始测试首颗自研AI训练芯片降低对英伟达依赖

Top 10

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

消息称中国开发出国产EUV工具挑战ASML的垄断地位

婉拒马斯克现在不回来特朗普阴阳滞留太空美宇航员：希望擦出爱的火花

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

消息称中国开发出国产EUV工具挑战ASML的垄断地位

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密