AAAI26 | 首个英文原生「弱智吧」！逻辑谬误数据集与生成框架来了（-源码库

在大模型已经能写代码、写论文的2025年，它们到底能不能看穿人类日常话术里的逻辑坑？最近，澳大利亚新南威尔士大学、复旦大学和卡内基梅隆大学组成的团队给出了一个系统答案：他们从英文Reddit社区里挖出了一个原生版「弱智吧」，构建了首个

2.24种逻辑谬误和他们的英文表述

高质量英文原生逻辑谬误基准SMARTYPAT-BENCH，并提出一个基于Prolog的逻辑谬误自动生成框架SMARTYPAT，论文已被AAAI收录。

AAAI26 | 首个英文原生「弱智吧」！逻辑谬误数据集与生成框架来了（插图

3.逻辑学谬误英文

参考资料：https://arxiv.org/abs/2504.12312论文的结论是：推理模型在有没有谬误这件事上反而更容易想太多，误把正常句子当谬误，但一旦确定有谬误，推理模型在这是什么谬误的分类任务上又明显更强，大模型与Prolog两者配合能显著提高逻辑谬误数据的质量和可控性。

4.逻辑谬误英语翻译

为什么要搞一个英文「弱智吧」基准？论文系统梳理了现有逻辑评测基准，并给它们分了四个维度NE：是否原生英文；CQ：是否包含狡猾提问（Cunning Question），类似弱智吧风格；RW：是否来自真实世界语料；。

5.逻辑谬论的英文

FL：是否有细粒度谬误标签。

AAAI26 | 首个英文原生「弱智吧」！逻辑谬误数据集与生成框架来了（插图1

6.逻辑谬误列表logical fallacies list

FOLIO、LogicBench等符号逻辑数据集：NE ✓，但 CQ / RW / FL 全 ✗，像「逻辑学课后习题」，形式严谨，却离自然语言很远；LOGIC、LFUD、BIG-Bench等：会从试题或百科句子改写，句子自然度好一些，但情境单薄、谬误类型粗糙；

7.八大逻辑谬误事例英语

COIG-CQIA、RuoZhiBench：来自中文论坛「弱智吧」，有真实世界狡猾提问，但要么是中文，要么是翻译到英文后语境变形，而且多没有细粒度标签在对比表里，SMARTYPAT-BENCH是唯一NE / CQ / RW / FL全部打勾的基准——既是原生英文，又真来自英文版弱智吧，还带精细的谬误类型标注。

8.常见逻辑谬误中英对照

Reddit版弱智吧从25万帖子里抠出502条有毒句子这次的SMARTYPAT-BENCH，灵感来自Reddit上著名的r/ShittyAskScience板块，里面充斥着类似这样的提问If smoking is so bad for you, how come it cures salmon?

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

AAAI26 | 首个英文原生「弱智吧」！逻辑谬误数据集与生成框架来了（

目录：

1.逻辑谬误英文版

2.24种逻辑谬误和他们的英文表述

3.逻辑学谬误英文

4.逻辑谬误英语翻译

5.逻辑谬论的英文

6.逻辑谬误列表logical fallacies list

7.八大逻辑谬误事例英语

8.常见逻辑谬误中英对照

9.逻辑谬误类型英文

10.逻辑谬误24种英文

1.逻辑谬误英文版

2.24种逻辑谬误和他们的英文表述

3.逻辑学谬误英文

4.逻辑谬误英语翻译

5.逻辑谬论的英文

6.逻辑谬误列表logical fallacies list

7.八大逻辑谬误事例英语

8.常见逻辑谬误中英对照

评论(0)

提示：请文明发言取消回复

推荐资源

蓝色大气化工滤料石材磨料生产厂家pbootcms模板

户外广告公司网站源码营销型户外岗亭网站PbootCms模板

小程序电商软件开发公司pbootcms模板[pc+wap]

注册记账财务会计公司注册类网站源码pbootcms模板

绿色生态农业企业网站pbootcms模板

大型农业机械设备类网站pbootcms模板

袜子生产定制针织袜业网站源码pbootcms模板

响应式文化传媒公司娱乐主播直播培训类网站源码pbootcms模板

AAAI26 | 首个英文原生「弱智吧」！逻辑谬误数据集与生成框架来了（

目录：

1.逻辑谬误英文版

2.24种逻辑谬误和他们的英文表述

3.逻辑学谬误英文

4.逻辑谬误英语翻译

5.逻辑谬论的英文

6.逻辑谬误列表logical fallacies list

7.八大逻辑谬误事例英语

8.常见逻辑谬误中英对照

评论(0)

提示：请文明发言 取消回复

相关文章

推荐资源

分类目录

提示：请文明发言取消回复