耗时 15 年、扫描 1400 个大脑!MIT 神经科学家发现了藏在人脑中的「生物版 ChatGPT」

MIT神经科学家Ev Fedorenko通过扫描约1400人大脑,识别出一个类似“生物版ChatGPT”的语言网络。它不负责思考或情绪,只专注于将词语与意义映射、拼成句子。该研究揭示了语言与思维的分离,让我们重新审视大脑中隐藏的奥秘。

如果告诉你:你的大脑中正跑着一个“生物版ChatGPT”,你会相信吗?

这不仅仅是个比喻,我们的大脑中确实存在这样一套专门用来处理语言的神经系统:

它不负责思考,也不负责情绪,而是专注于一件事——把词和意义对上号,再把它们拼成句子。

这个系统被神经科学家Ev Fedorenko称作“语言网络”(language network)。

大脑天生的LLM系统

很多人会觉得语言和思考是同一过程,找词的过程本身就是思考。

但人类的语言和思维真的是同一回事吗?语言究竟是思维的核心,还是一个完全独立的过程?

对此,Fedorenko提出了一个稍显反直觉的观点:

语言≠思考,它更像是思考的“接口”和“外包装”。

对许多人来说,找到合适的词是思考的重要组成部分,而不是某个独立系统的产出。

她把这个独立于思考之外的专门系统称为“语言网络”,用来映射词语与其意义之间的对应关系。

Fedorenko将它想象成一个加强版的解析器:

“它就像一张地图,告诉你大脑里哪一块地方存着哪一类意义,也好比一个加强版的解析器,帮我们把语言拼起来。”

真正的思考和有趣的认知活动,则全部发生在这个语言网络之外。

事实上,在ChatGPT问世之前的15年里,Fedorenko一直致力于收集人类大脑中语言网络的证据,发现它和大模型(LLM)之间竟有许多相似之处。

在某些意义上,我们确实随身携带着一个“生物版的ChatGPT”——一个不具备心智的语言处理器。

这或许给人带来一些安慰:机器虽然能生成流畅文字,但并不意味着它会思考。

在麻省理工学院的实验室中,Fedorenko花了15年时间积累关于语言网络的生物学证据。

不同于大模型,人类语言网络不会随意串词生成听起来合理的句子;它更像是一座连接外部输入(听觉、视觉、甚至手语)和大脑其他区域意义表征(如情景记忆、社会认知——而LLM并无此能力)之间的翻译器。

另外,人类语言网络的体积不大,所有相关组织加在一起只有一颗草莓大小。

尽管体积小,一旦受损,影响却非常严重。

比如语言网络受损会导致各种失语症,这种情况下,人的复杂思维依然存在,却被困在无法表达的脑中;有时甚至难以辨别他人讲的词。

Fedorenko在MIT与博士后研究员Andrea de Varda(左)和Halie Olson(右)

扫描1400人大脑,她发现了人脑中的“语言网络”

Fedorenko出生于上世纪80年代的苏联,自幼对语言产生浓厚兴趣。在母亲的要求下,她学会了俄语、英语、法语、德语、西班牙语和波兰语六种语言。

凭借优异的成绩,她获得了哈佛大学的全额奖学金,主修语言学。然而在学习过程中,她发现语言学的局限:

“这些语言学课程很有趣,但更像是在解谜,而不是在解释现实世界到底是如何运转的。”

随后她转学心理学,2002年毕业获得心理学与语言学双学士学位。

之后,Fedorenko进入麻省理工学院(MIT)攻读认知科学与神经科学的研究生课程,并于2007年获得博士学位。

期间,她开始与Nancy Kanwisher合作,后者曾首次发现梭状回脸区(专门负责识别人脸的脑区)。Fedorenko希望找到语言在大脑中的对应区域,但当时相关研究基础相当薄弱。

通过对约1400名受试者的大脑扫描,Fedorenko识别出一个普遍存在的语言网络,定义为“始终负责语言计算的组织”。

积累丰富研究成果后,2024年她在《Nature Reviews Neuroscience》发表综述,将人类语言网络定义为一种“自然类别”——一种天然、独立成型、专门处理语言的功能单元,存在于“每一位典型成年人体内”。

Fedorenko办公室里的三个大脑模型突出了语言网络。从上到下:紫色的是Laura Bundesen的刺绣作品;红色的是Hannah Small的十字绣;红色的是3D打印模型。

什么是语言网络?

成年人大脑中存在一组核心区域,它们组成互相连结的系统,专责计算语言结构。

这些区域存储着词语与意义之间的映射关系,以及如何将词语组合成句子的规则。

学习一门语言,实际上就是掌握这些规则和映射。

只要熟练掌握,便能灵活使用这套“代码”:凭借所学语言,将脑中念头转换成词序。

Fedorenko表示,语言网络和人体其他器官一样,是一个“自然类别”,拥有具体的、可定位的物理结构。

例如梭状回脸区就是一个明确界定的功能单元。

在语言网络中,大多数人的额叶皮层有三个关键区域,位于左额叶侧面;此外,中颞回的侧面还有几个区域,形成沿整个颞叶延伸的厚厚组织,这些构成语言网络的核心部分。

我们可以从多个角度观察这些区域的整体性。

例如,在fMRI扫描中,观察语言处理任务与对照条件的对比时,这些区域总是同步激活。

Fedorenko称,她迄今已扫描约1400人,建立了一个概率地图,展示语言网络最可能出现的部位。

虽个体存在差异,但整体模式极为一致:在额叶和颞叶大区,每个人都有特定组织可靠执行语言计算。

语言网络与其他已知的语言相关脑区如布罗卡区(Broca’s area)不同。

Fedorenko认为布罗卡区主要负责发音动作规划,根据语音表征,计算说出声音所需动作,指挥口部肌肉,是语言网络的下游,接收并执行语言网络传递的结构化语言信息。

语言网络本身既不负责发声,也不负责思考,本质上是低层级的感知与运动系统,是连接高层抽象意义和推理系统的接口。

人类主要通过语言完成两件事:

  • 表达:脑中浮现念头后,从词库(不仅是词汇,还有更大的结构和组合方式)挑选词序,将念头表达出来。语言网络将词序传递给运动系统,实现说话、书写或手语表达。
  • 理解:声音进入耳朵或光线进入眼睛后,感知系统先处理输入形成词序,语言网络解析词序,识别熟悉“块”,并对应到存储在其他脑区的意义表征。

语言网络是一个不断更新的“形式到意义的映射仓库”。掌握这套编码,我们既能表达想法,也能理解他人。

那么,语言网络的专门化程度如何?是否存在专门针对某些话语反应的神经元?

Fedorenko认为语言依赖上下文,编码方式可能是分布式的,部分神经元对语言特定方面反应更强。例如,语言网络某些细胞对书面语和听觉语言反应类似。

谈及语言网络的模式和特征,她认为大脑物体识别机制与语言网络的抽象层次相似。这类似于下颞皮层存储物体形状片段、梭状回脸区存储“脸的模板”。

我们使用这些表征识别现实世界中物体,但它们并不直接承载世界知识。

以无意义句子“无色的绿色想法愤怒地沉睡”为例,我们大致能理解其结构,却无法对应任何现实知识。

Fedorenko和团队证实,语言网络对这类无意义句子的反应强度,与有意义句子相差无几。

这不代表语言网络“笨”,而是说明它是较浅层的系统。

Fedorenko认同“每个人脑中都有个LLM”的说法。她认为语言网络在诸多方面类似早期大模型:学习语言规律和词与词间关系。

现实中,你可能遇到一个说话流畅的人,但他们所讲内容空洞,其大脑语言网络运作正常,而思考部分却未被动用。

尽管人类语言来自类似ChatGPT这样“无意识”的系统,这听起来违背直觉,但Fedorenko早期研究亦曾认同语言是高级思维核心,后续研究不再支持这一观点。

早在2011年,她已明确语言网络各部分高度专门化用于语言处理。

“作为科学家,我们只能更新认知,继续探索未知。”

参考资料:

本文来自微信公众号:新智元(ID:AI_era)

https://finance.sina.com.cn/tech/digi/2025-12-06/doc-infzwuew5345600.shtml

More From Author

KD:狄龙是敢于发声领袖 他不断进步信心更足这或是从火箭开始的

今日大雪!幸福绵长,祝你安康!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注