1.陶哲轩参加国际奥林匹克数学竞赛的成绩

「AI奥数」第二届大赛,英伟达团队(NemoSkills)曾夺下第一!这一次,AIMO2组委会再次重启赛题,OpenAI o3首次参赛,就拿下了最亮眼的成绩陶哲轩激动表示,过去,这个比赛仅限于开源模型,计算资源也卡得比较紧。

陶哲轩都惊了!o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI(插图

2.陶哲轩花7小时奥数问题

庆幸的是,AIMO第二轮比赛中,NemoSkills和清华微软imagination research、以及o3同时参赛测试分为两种条件:一种给差不多的计算资源,另一种是放开算力随便跑结果也在意料之中,算力给得越足,模型表现越好。

3.陶哲轩7小时的一道imo难题

在算力管够的情况下,OpenAI o3成绩直接飙到了47分(满分50分)甚至,每道题给两次机会的话,还能冲满分另一个有意思的情况是,在计算资源相同的情况下,开源模型和商业模型的差异其实并不大今天,这份完整的研究测试报告正式放出。

陶哲轩都惊了!o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI(插图1

4.陶哲轩3n 1

报告地址:https://aimoprize.com/updates/2025-09-05-the-gap-is-shrinking一起来看看,o3在具体实测中的表现奥数级难题,AI扛把子对于科学可复现性,确保开源模型广泛可得至关重要。

5.陶哲轩奥林匹克

但开源模型与闭源模型之间的性能差距到底有多大?在数学推理情境下,这次的测评提供了更细致的理解:在奥数难度的数学推理上,商用和开源AI的差距在缩小。开源即将追上商用模型。

陶哲轩都惊了!o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI(插图2

6.数学天才陶哲轩简介

去年,Epoch AI估计:当今最好的开源模型在性能和训练算力方面与封闭模型相当,但存在大约一年的差距人工智能数学奥林匹克(AIMO)创立于2023年,旨在推动开源AI模型在高阶数学推理的的发展。

陶哲轩都惊了!o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI(插图3

7.陶哲轩竞赛

比赛传送门:https://www.kaggle.com/competitions/ai-mathematical-olympiad-progress-prize-2/overview2025年4月,第二届AIMO进展奖(AIMO Progress Prize 2,简称AIMO2)收官。

8.imo陶哲轩

本阶段题目难度进一步提升,主要围绕各国奥赛级别(如英国数学奥林匹克BMO、美国数学奥林匹克USAMO)。

陶哲轩都惊了!o3首战「AI奥数」碾压夺冠,开源军团仅差5分狂追OpenAI(插图4

9.陶哲轩没做出来的imo题目

AIMO2私榜的前五名队伍及其成绩如下(括号内为公榜成绩):NemoSkills:34/50(公榜:33/50)imagination-research:31/50(公榜:34/50)Aliev:30/50(公榜:28/50)

10.难倒陶哲轩7小时的一道imo难题

sravn:29/50(公榜:25/50)usernam:29/50(公榜:25/50)Kaggle的「公榜」在赛事全程向参赛者可见,为了避免数据泄露,并不会公开数据

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。