OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密

2025年02月12日 19:51 次阅读稿源：凤凰网科技条评论

在中国AI公司的影响下，OpenAI不得不公开O系列强化学习的秘密。今天（2月12日），OpenAI发布了关于推理模型在竞技编程中应用的研究论文报告《Competitive Programming with Large Reasoning Models》，文中放出了OpenAI三个推理模型：o1、o1-ioi、o3在IOI（国际信息学奥林匹克竞赛）和CodeForces（全球知名在线编程竞赛）中的成绩。

论文显示，在IOI 2024中，o3在严格规则下拿到395.64分，达成金牌成就，并且在CodeForces上的表现与人类精英选手相当。论文中特别提到，中国的DeepSeek-R1和Kimi k1.5通过独立研究显示，利用思维链学习（COT）方法，可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

该论文通过强化学习（RL）训练的大型语言模型在复杂编码和推理任务上的性能提升，比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明，增加强化学习训练计算和测试时计算可显著提升模型性能，使其接近世界顶尖人类选手，这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

原论文地址：https://arxiv.org/abs/2502.06807

对文章打分

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密

13 (68%)

6 (32%)

已有条意见

编辑精选

加载中...

Top 10

本周本月

招聘

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密

对文章打分

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密

最新资讯

编辑精选

热门评论

相关文章

传DeepSeek-R2将于下周一发布在多个关键领域实现突破

李想：通用人工智能近两年不能赚钱但会破坏传统商业赚钱模式

亚马逊CEO：亚马逊云科技上线DeepSeek-R1全托管服务这是“行业首例”

彭博社关注Manus：美国AI优势再遭挑战，产品评价褒贬不一

海外AI圈开始讨论Manus

OpenAI撬动微软的云服务“小弟” 119亿美元大单引发市场诸多猜想

Top 10

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

消息称中国开发出国产EUV工具挑战ASML的垄断地位

婉拒马斯克现在不回来特朗普阴阳滞留太空美宇航员：希望擦出爱的火花

亚洲最大露天煤矿百米厚煤层足足开采了118年古代植物咋都埋那了？

消息称中国开发出国产EUV工具挑战ASML的垄断地位

OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密