1.英国米其林厨师

最近,NVIDIA Research发现,只要经过适当微调,小模型已足以「指挥」大模型英伟达研究团队的新模型Orchestrator仅有 80 亿参数(8B)的模型,不仅比以往的工具使用类AI智能体准确率更高、成本更低,还能在工具选择上精准对齐用户的偏好。

2.米其林大厨英国

在HLE基准测试中,Orchestrator斩获了37.1%的高分,一举超越了GPT-5(35.1%),同时在效率上提升了2.5倍在tau2-Bench和FRAMES测试中,Orchestrator同样以大幅优势领先 GPT-5,而其成本仅为后者的30%左右。

3.米其林的主厨

在多项指标上,Orchestrator均实现了性能与成本的最佳平衡,并能出色地泛化至未曾见过的工具中。

别让米其林主厨削土豆!英伟达用「小脑指挥大脑」,重构AGI生产力(插图

4.米其林餐厅土豆做法

预印本链接:https://arxiv.org/abs/2511.21689

别让米其林主厨削土豆!英伟达用「小脑指挥大脑」,重构AGI生产力(插图1

5.米其林厨师炒菜视频

为什么「强模型 工具」还是不够好?面对Humanity’s Last Exam(HLE)这类超难综合推理考试,现在的大模型虽然「什么都懂一点」,但一到深度推理 控制成本就开始吃力只靠一个大模型(比如GPT-5)去调用搜索、代码解释器这些基础工具,很难同时做到:。

6.米其林厨师吃中国菜

够准、够便宜、够可控为了省钱,业界第一反应是:别什么都让最强模型上,搞个「调度者」来分配任务但真把主流大模型拉来做调度者,结果却很讽刺:当GPT-5做调度时,98%的请求还是落回GPT-5或GPT-5-mini。

7.米其林厨师做饭的视频

;换成Qwen3-8B,当它拿不准时,73%的任务直接无脑丢给GPT-5。换句话说:我们以为造了个「调度者」,结果只是多请了一个「转接电话的前台」。

别让米其林主厨削土豆!英伟达用「小脑指挥大脑」,重构AGI生产力(插图2

8.米其林厨艺大师

使用不同模型作为调度者后,给不同模型分配的任务结果说明,仅仅通过提示词,无法让常见的大模型变成合格的调度者而ToolOrchestra,通过将「智能」从单一模型中解耦,重构为「轻量调度中枢 异构能力工具集」的复合系统,构成了一种全新的模型与工具协同范式。

9.英国米其林厨师来中国是什么节目

接下来,看看Orchestrator是怎么训练出来的Orchestrator:多轮执行与自定义RL想象一下:过去的大模型,都像高端餐厅,全靠「米其林主厨」(GPT-5)从头到尾亲自炒菜——火候、刀工、摆盘,全靠一人。

10.米其林厨师视频

结果呢?由于单个token成本很高,导致总成本直接原地起飞而英伟达新推出的「拼好饭」模式如同中央厨房,一个聪明的「调度店长」(8B小模型Orchestrator)驻守中央,店长不亲自炒菜,而是:让街角「川菜小馆」(Qwen-Math-7B)爆炒回锅肉(数学题);。

招「粤式点心师傅」(Coder-32B)蒸一笼虾饺(写代码);实在拿不准?叫米其林主厨(GPT-5)来尝一口、定个味。

别让米其林主厨削土豆!英伟达用「小脑指挥大脑」,重构AGI生产力(插图3

Orchestrator的架构图其中用于调度的8B小模型Orchestrator,会通过强化学习,根据用户声明的倾向,系统自动倾向本地部署模型而训练过程中的奖励函数,可分为3部分:1. 结果,即是否答对,答对 1,否则0;由GPT5给出判断;

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。