1.降智是什么

OpenAI打出了GPT-5.2这张「年度王牌」,却没有打赢谷歌…

GPT-5.2降智遭全网差评!奥特曼慌了(插图

2.降智打击表情包

Epoch AI最新报告,GPT-5.2的能力指数(ECI)得分152,仅次于Gemini 3 Pro。

GPT-5.2降智遭全网差评!奥特曼慌了(插图1

3.降智buff是什么意思

在多项基准测试中,GPT-5.2的实力并没有「全线霸榜」在由陶哲轩联手百位数学家出的考题——FrontierMath中,GPT-5.2仅在T1-3级中霸榜,T4还是Gemini 3的高地另外,在国际象棋Chess Puzzles中,GPT-5.2拿下了第一的成绩。

4.降智打击什么意思

唯一例外的是,在SimpleQA Verified上,GPT-5.2都不及GPT-5.1,意味着迭代后的可信度更差了。

GPT-5.2降智遭全网差评!奥特曼慌了(插图2

5.降智表情包

不仅如此,多个第三方基准评测显示,GPT-5.2远不及预期,没有打败Gemini 3。

GPT-5.2降智遭全网差评!奥特曼慌了(插图3GPT-5.2降智遭全网差评!奥特曼慌了(插图4

6.降智什么意思

包括OCR-Arena、simple-bench、Live-Bench上,GPT-5.2甚至都排在了Claude Opus 4.5之后。

GPT-5.2降智遭全网差评!奥特曼慌了(插图5GPT-5.2降智遭全网差评!奥特曼慌了(插图6GPT-5.2降智遭全网差评!奥特曼慌了(插图7

发布仅两天,GPT-5.2水花不大,反而圈子里开发者吐槽的不少为了打赢这场硬仗,OpenAI拉响「红色警报」,把改进ChatGPT事项提到了优先级更极端的是,内部直接停掉了AGI的研发,Sora也暂停了八周,显然摆出了破釜沉舟的姿态。

GPT-5.2降智遭全网差评!奥特曼慌了(插图8

可是呢,在业界来看,OpenAI至今仍未摆脱被动的局面。GPT-5重度用户站出来发声,「GPT-5.2距离成为一块石头也不远了」。

GPT-5.2降智遭全网差评!奥特曼慌了(插图9

年终之战,OpenAI败了?三年前,谷歌因错失先机,被OpenAI ChatGPT抢尽了风头昨天,谷歌创始人谢尔盖·布林重返斯坦福演讲,现场公开承认曾经的「最大失误」:我们搞砸了——太怕AI说错话,结果输掉一个时代。

GPT-5.2降智遭全网差评!奥特曼慌了(插图10

如今,凭借Gemini 3 Pro Nano Banana Pro,谷歌已重回AI浪潮之巅。风水轮流转。这一次,轮到了OpenAI,却在2025年这场关键战役中自乱阵脚。

GPT-5.2降智遭全网差评!奥特曼慌了(插图11

上线首日,奥特曼激动宣称,API调用量就超过了万亿token,且增长速度极快此前Information爆料,GPT-5.2,代号大蒜(Garlic),原计划在明年初亮相整个硅谷,曾透露了一种风声——OpenAI预训练终结了,甚至GPT-5.1可能基于4o后训练而来,由此提升不大。

确实如此,在预训练上,OpenAI遇到了Scaling瓶颈。

GPT-5.2降智遭全网差评!奥特曼慌了(插图12

预训练Scaling,或许不大在GPT-5.2(大蒜)研发上,原爆料称,OpenAI解决了预训练环节遇到的一些关键问题——改进之前「最好的」且「体量大得多」的预训练模型在内部,OpenAI整合了在开发「Shallotpeat」期间修复的Bug,积累了许多预训练的经验。

正如Information所言,最关键的突破发生在「预训练阶段」。

GPT-5.2降智遭全网差评!奥特曼慌了(插图13

但以上的一切信息,都是新闻报道。OpenAI究竟在预训练上,是否实现了重大突破,难以得知。但从官方全线击败Gemini 3基准上可以猜测,GPT-5.2在预训练方面取得了一定的改进。

GPT-5.2降智遭全网差评!奥特曼慌了(插图14

但是从第三方评测和网友反馈中,GPT-5.2在底层技术迭代上,没有实现突破式的进展。

GPT-5.2降智遭全网差评!奥特曼慌了(插图15GPT-5.2降智遭全网差评!奥特曼慌了(插图16GPT-5.2降智遭全网差评!奥特曼慌了(插图17

Epoch AI另一项评估中,顶尖AI大模型在长程任务的性能,Gemini 3依旧是最强的——Gemini 3 Pro:4.9小时

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。