NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型，AceSearcher来了-源码库

如何让一个并不巨大的开源大模型，在面对需要多步检索与复杂逻辑整合的问题时，依然像 “冷静的研究员” 那样先拆解、再查证、后归纳，最后给出可核实的结论？近期，来自埃默里大学，佐治亚理工大学，罗格斯大学，纽约州立大学奥尔巴尼分校，得克萨斯大学西南医学中心的研究团队发布 AceSearcher 模型，一个让同一语言模型在推理时兼任 “问题分解者（Decomposer）” 与 “答案求解者（Solver）” 的合作式自博弈框架：它以两阶段训练（SFT→RFT）为骨架，把 “会拆题、会找料、会整合” 的完整能力链拧成了一根绳。

2.neurips2026截稿时间

更重要的是，这不是单纯的 “又一个新模型”，而是一个更优的框架：它把公开的推理数据集引入到检索增强的训练流程中，让模型真正学会如何把推理与检索结合起来，显著提升了复杂检索任务的效果在三大类推理密集任务、十个数据集上，它拿到了平均 EM 7.6% 的优势；32B 版本在文档级金融推理上，表现可对标 685B 的 DeepSeek-V3，但参数量却不到 5%。

NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型，AceSearcher来了插图

3.NeurIPS2026投稿时刻表

论文题目：AceSearcher: Bootstrapping Reasoning and Search for LLMs via Reinforced Self-Play接收会议：NeurIPS 2025 Spotlight

4.NeurIPS2026

论文地址：https://arxiv.org/pdf/2509.24193模型 / 数据集地址：https://huggingface.co/AceSearcher代码地址：https://github.com/ritaranx/AceSearcher/

5.neurips2025

把人类的 “拆解 — 检索 — 整合” 过程，规约成一个统一策略现实世界的问题，常常不是 “一问一答” 能解决：线索散落在不同文档，需要多跳检索把证据拼齐，还要在此基础上进行跨段落乃至跨文档的整合推理传统 RAG 在这里容易 “卡壳”—— 单步检索召回不足、推理链整合不稳、推理时扩展又容易带来延迟和资源开销。

6.neurips2025出分时间

AceSearcher 的关键，是把这一流程变成一个单模型、双角色的闭环：分解者

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型，AceSearcher来了

目录：

1.neurips2026举办地

2.neurips2026截稿时间

3.NeurIPS2026投稿时刻表

4.NeurIPS2026

5.neurips2025

6.neurips2025出分时间

7.neurips2025会议地点

8.neurips2025在哪开

9.neurips2025出结果

10.neurips2025含金量

1.neurips2026举办地

2.neurips2026截稿时间

3.NeurIPS2026投稿时刻表

4.NeurIPS2026

5.neurips2025

6.neurips2025出分时间

评论(0)

提示：请文明发言取消回复

推荐资源

户外广告公司网站源码营销型户外岗亭网站PbootCms模板

小程序电商软件开发公司pbootcms模板[pc+wap]

注册记账财务会计公司注册类网站源码pbootcms模板

蓝色大气化工滤料石材磨料生产厂家pbootcms模板

绿色生态农业企业网站pbootcms模板

大型农业机械设备类网站pbootcms模板

袜子生产定制针织袜业网站源码pbootcms模板

响应式文化传媒公司娱乐主播直播培训类网站源码pbootcms模板

NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型，AceSearcher来了

目录：

1.neurips2026举办地

2.neurips2026截稿时间

3.NeurIPS2026投稿时刻表

4.NeurIPS2026

5.neurips2025

6.neurips2025出分时间

评论(0)

提示：请文明发言 取消回复

相关文章

推荐资源

分类目录

提示：请文明发言取消回复