目录:
1.加州理工mit
2.eric winfree加州理工
3.加州理工大学华裔
4.加州理工中国人
5.加州理工官网
6.加州理工院系
7.加州理工ee phd
8.加州理工ee
9.加州理工学院华人教授
10.加州理工phd
1.加州理工mit
AI真的有「性格」吗?有人拿它做过大五人格测试,发现它回答得既友善,又不焦虑,甚至比人类更稳定于是有了各种趣味解读:有的模型像外向的ENFP,有的则更像严谨的ISTJ,好像AI也能被贴上MBTI标签可最新一篇来自加州理工、剑桥等机构的论文,却泼下了一盆冷水:
2.eric winfree加州理工
LLM的「人格」,也许只是语言制造的幻觉。

3.加州理工大学华裔
论文地址:https://arxiv.org/abs/2509.03730项目主页:https://psychology-of-ai.github.io/研究者不仅让模型做问卷,还设计了一系列行为实验结果令人意外:。
4.加州理工中国人
模型说出来的性格,与实际行为几乎对不上那么,这个「人格幻觉」是怎么被发现的?问卷里的人格:AI比人还「完美」?在这项研究里,团队把「大模型到底有没有人格」拆成了三步:先看语言上的自报特质(RQ1),再测真实任务的行为表现(RQ2),最后尝试用persona注入来调控(RQ3)。

5.加州理工官网
从预训练到对齐,再到persona提示注入的整体流程如果只看心理问卷,大语言模型简直是「模范人格」研究团队首先采用了心理学里常见的两类自评工具:大五人格问卷和自我调节量表这些量表在人类研究中被广泛用来描绘一个人的性格特质,比如是否外向、是否友善,是否能够控制冲动。
6.加州理工院系
当研究者把这些问卷交给不同阶段的大模型时,结果显示出一个清晰的趋势:随着指令微调(SFT)、人类反馈强化学习(RLHF)、DPO 等对齐方法的叠加,模型的「人格画像」越来越稳定、越来越「乖巧」具体表现在哪里呢?在大五人格的维度上,开放性和宜人性显著上升,神经质显著下降。
7.加州理工ee phd
也就是说,它看上去更开朗、友善,也更少焦虑和不稳定。

8.加州理工ee
不同训练阶段LLM的自报人格特征可以看到,经过RLHF的模型,在宜人性、尽责性等维度上得分更高,神经质更低,呈现出「更乖巧」的人格形象与此同时,模型在问卷上的波动幅度也明显减少:Big Five的变异度下降约40%,自我调节下降约45%。
9.加州理工学院华人教授
研究还发现,这些特质之间的相关结构,也比预训练阶段更接近人类群体的数据从结果来看,对齐让模型呈现出一个「理想合作者」的人格:开朗、友好、稳定、可靠——甚至比大多数人类受试者的自评还要完美这项研究由一个跨学科团队联合完成。
10.加州理工phd
但这样近乎完美的形象,真的可信吗?为了回答这个问题,一个跨学科的研究团队走到了一起,既有计算机背景的青年研究者,也有认知神经科学、社会学等领域的教授他们想要用实验揭穿这层光鲜外壳,而这背后的探索,是由一位跨学科背景的年轻学者领衔。
第一作者是伊利诺伊大学香槟分校(UIUC)计算机系研究生韩芃睿,他同时在麻省理工学院脑与认知科学系担任科研助理,兼具计算机与心理学的双重背景。

合作者阵容同样多元:既有加州理工的博士后Rafal Kocielnik和本科生宋沛洋,也有来自剑桥大学的数学与社会学教授Ramit Debnath;此外,还包括加州理工脑成像中心主任、认知神经科学教授Dean Mobbs,政治学与计算社会科学教授R. Michael Alvarez,以及通讯作者、前英伟达AI研究主任、加州理工教授


评论(0)