文心一言数学和中文理解能力全球第几？清华最新报告出炉

2024年04月21日 23:42 次阅读稿源：凤凰网科技条评论

4月21日，由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架，正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》，结果显示：文心一言4.0表现亮眼，与国际一流模型水平接近，且差距已经逐渐缩小。

在人类对齐能力评测中，文心一言4.0位居国内第一；中文理解上，文心一言4.0领先第二名GLM-4 0.41分，GPT-4系列模型表现较差，和文心一言4.0分差超过1分。

在语义理解中的数学能力上，文心一言4.0与Claude-3并列全球第一； GPT-4系列模型位列第四五，其他模型得分在55分附近较为集中；在语义理解中的阅读理解能力上，文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

在安全性评测上，国内模型文心一言4.0拿下最高分（89.1分），Claude-3仅列第四。

据悉，自文心一言首发至今，用户数已突破2亿。

责任编辑：ugmbbc

对文章打分

文心一言数学和中文理解能力全球第几？清华最新报告出炉

1 (50%)

1 (50%)

已有条意见

最新资讯

加载中...

编辑精选

加载中...

热门评论

相关文章

GPT-4化身黑客搞破坏成功率87% OpenAI要求保密提示词有人还搞起了复现
- 3 分钟前
周鸿祎：我不是针对李彦宏开源一定会超过闭源
- 昨天 19:37
AI 正在“吸干”全球电力？更可怕的事还在后面
- 昨天 16:18
OpenAI抨击马斯克是在"修正历史" 要求法庭驳回诉讼
- 昨天 16:11
全球首届AI选美大赛拉开帷幕：冠军将获得13000美元奖金
- 昨天 15:38

Top 10

本周本月

1
华为纯血鸿蒙真机界面曝光无法运行Android应用

阅读 (10352) 评论 (3)
2
华为Pura 70 Ultra全网首拆全新麒麟芯片现真身

阅读 (8639) 评论 (0)
3
微信聊天加个#号居然如此方便

阅读 (7692) 评论 (0)
4为什么人类不能喝生水，动物都直接喝？
5Bose睡眠产品悄然退出大陆：高价耳机一夜间变电子垃圾？
6单价4亿美元的光刻机 ASML又卖了一台
7测试表明麒麟9010的功耗与初代高通骁龙8 Plus类似但性能低30%
8P70首发的华为麒麟9010性能表现首秀：提升不少
9年轻人开始买“二手黄金”
10特斯拉裁员开启：扫描员工工卡失效即立刻送回

1
为了让父母多投喂自己这种雏鸟长出恐怖的鸟嘴

阅读 (14561) 评论 (7)
2
“华为微信谈判进入僵局”上热榜

阅读 (10536) 评论 (12)
3
华为纯血鸿蒙真机界面曝光无法运行Android应用

阅读 (10358) 评论 (3)
4英国捉到比狗还大的老鼠足足56厘米长为什么变得这么大？
5华为Pura 70 Ultra全网首拆全新麒麟芯片现真身
6微信聊天加个#号居然如此方便
7终于意识到不对劲微软从Windows Server 2025中删除Copilot
8为什么人类不能喝生水，动物都直接喝？
9中国特供RTX 4090D偷偷解锁600W功耗性能反超RTX 4090
10Bose睡眠产品悄然退出大陆：高价耳机一夜间变电子垃圾？

招聘