03 头脑中的世界模型

A Model of the World in Your Head 头脑中的世界模型

大脑的功能看起来似乎很明显：大脑从感觉器官获取输入，处理这些输入，然后做出行动。归根结底，动物对感知到的事物做出怎样的反应决定了它的成败。从感觉输入到行动的直接映射确实适用于大脑的某些部分。例如，不小心碰到滚烫的表面会引发手臂的反射性缩回，负责这一输入-输出回路的结构位于脊髓。但新皮层呢？我们能说新皮层的任务就是接收感觉输入然后立即行动吗？简而言之，不能。

你正在阅读或聆听这本书，除了翻页或触摸屏幕之外，它并没有引起任何即时行动。成千上万的文字涌入你的新皮层，而你大部分时候并没有对它们采取行动。也许以后你会因为读了这本书而有所不同。也许你将来会进行一些关于大脑理论和人类未来的对话，如果没有读这本书就不会有这些对话。也许你未来的思考和用词会受到我文字的微妙影响。也许你会基于大脑原理去创造智能机器，而我的文字会激励你朝这个方向前进。但此刻，你只是在阅读。如果我们坚持把新皮层描述为一个输入-输出系统，那么最好的说法是：新皮层获取大量输入，从这些输入中学习，然后——也许几小时后，也许几年后——基于这些先前的输入做出不同的行为。

从我对大脑工作方式产生兴趣的那一刻起，我就意识到把新皮层看作一个"输入导致输出"的系统不会有什么成果。幸运的是，当我在伯克利读研究生时，我获得了一个洞见，引导我走上了一条不同且更成功的道路。当时我在家里的书桌前工作，桌上和房间里有几十件物品。我意识到，如果其中任何一件物品发生了哪怕最微小的变化，我都会注意到。我的笔筒一直在桌子右边；如果有一天我发现它在左边，我会注意到这个变化并想知道它是怎么被移动的。如果订书机的长度变了，我会注意到。无论是触摸订书机还是看着它，我都会注意到变化。甚至如果订书机使用时发出不同的声音，我也会注意到。如果墙上时钟的位置或样式变了，我会注意到。如果我把鼠标向右移动而屏幕上的光标却向左移动，我会立刻意识到出了问题。让我震惊的是，即使我并没有刻意关注这些物品，我也会注意到这些变化。当我环顾房间时，我并没有问自己"我的订书机长度对吗？"我也没有想"检查一下时钟的时针是否仍然比分针短。"对正常状态的改变会自动跳入我的脑海，然后我的注意力才被吸引过去。在我的环境中，有成千上万种可能的变化是我的大脑几乎能瞬间注意到的。

我能想到的唯一解释是：我的大脑，具体来说是我的新皮层，正在同时做出多个预测（prediction），预测它即将看到、听到和感觉到什么。每次我移动眼睛，新皮层都会预测即将看到什么。每次我拿起东西，新皮层都会预测每根手指应该感觉到什么。我的每一个动作都会引发对应该听到什么的预测。我的大脑预测最微小的刺激，比如咖啡杯把手的纹理，也预测宏大的概念性想法，比如日历上应该显示的正确月份。这些预测发生在每一种感觉模态中，涵盖低层感觉特征和高层概念，这告诉我新皮层的每一个部分，因此每一个皮层柱（cortical column），都在做预测。预测是新皮层无处不在的功能。

当时，很少有神经科学家把大脑描述为一台预测机器。关注新皮层如何做出许多并行预测，将是研究其工作方式的一种新颖途径。我知道预测不是新皮层做的唯一事情，但预测代表了一种系统性地攻克皮层柱之谜的方式。我可以提出关于神经元如何在不同条件下做出预测的具体问题，这些问题的答案可能揭示皮层柱做什么以及如何做到。

为了做出预测，大脑必须学习什么是正常的——也就是说，基于过去的经验应该期待什么。我之前的书《论智能》（On Intelligence）探讨了这个学习与预测的想法。在那本书中，我用"记忆-预测框架（memory prediction framework）"来描述这个总体思想，并讨论了以这种方式思考大脑的意义。我论证了，通过研究新皮层如何做出预测，我们将能够揭开新皮层的工作原理。

今天我不再使用"记忆-预测框架"这个说法。取而代之的是，我用另一种方式描述同样的想法：新皮层学习一个世界模型（model of the world），并基于这个模型做出预测。我更喜欢"模型"这个词，因为它更精确地描述了新皮层学习的信息类型。例如，我的大脑有一个关于订书机的模型。这个模型包括订书机看起来是什么样的、摸起来是什么感觉、使用时发出什么声音。大脑的世界模型包括物体在哪里以及当我们与它们互动时它们如何变化。例如，我的订书机模型包括订书机顶部相对于底部如何移动，以及当顶部被按下时订书钉如何弹出。这些动作看起来很简单，但你并非生来就知道这些，你在生命中的某个时刻学会了它们，现在它们存储在你的新皮层中。

大脑创建的是一个预测性模型（predictive model）。这意味着大脑持续预测其输入将会是什么。预测不是大脑偶尔做的事情；它是一种永不停止的内在属性，并且在学习中扮演着关键角色。当大脑的预测被验证时，意味着大脑的世界模型是准确的。一次错误预测会让你注意到这个错误并更新模型。

"We are not aware of the vast majority of these predictions unless the input to the brain does not match."

我们对绝大多数预测毫无察觉，除非大脑的输入与预测不匹配。当我随手去拿咖啡杯时，我并没有意识到我的大脑正在预测每根手指将感觉到什么、杯子应该有多重、杯子的温度如何、以及把杯子放回桌上时会发出什么声音。但如果杯子突然变重了、变冷了、或者发出了吱吱声，我就会注意到变化。我们可以确定这些预测正在发生，因为即使是这些输入中任何一个微小的变化都会被注意到。但当预测正确时——大多数情况下都是如此——我们不会意识到预测曾经发生过。

当你出生时，你的新皮层几乎什么都不知道。它不认识任何文字，不知道建筑物是什么样的，不知道如何使用电脑，也不知道门是什么以及它如何在铰链上移动。它必须学习无数的东西。新皮层的整体结构并非随机的——它的大小、它拥有的区域数量以及这些区域如何相互连接，在很大程度上由我们的基因决定。例如，基因决定了新皮层的哪些部分连接到眼睛，哪些部分连接到耳朵，以及这些部分如何相互连接。因此，我们可以说新皮层在出生时就被构建为能够看、听，甚至学习语言。但同样真实的是，新皮层并不知道它将看到什么、将听到什么、以及可能学习哪种具体语言。我们可以把新皮层想象为在生命之初带着一些关于世界的内置假设，但对具体事物一无所知。通过经验，它学习到一个丰富而复杂的世界模型。

新皮层学习的东西数量巨大。我坐在一个有数百件物品的房间里，随机挑一个：打印机。我已经学会了一个关于打印机的模型，包括它有一个纸盒，以及纸盒如何从打印机中推入和拉出。我知道如何更换纸张大小，如何拆开一包新纸并放入纸盒。我知道清除卡纸需要采取的步骤。我知道电源线一端有一个D形插头，只能以一个方向插入。我知道打印机的声音，以及双面打印时声音与单面打印时有何不同。房间里另一个物品是一个小型两抽屉文件柜。我能回忆起关于这个柜子的几十件事，包括每个抽屉里有什么以及抽屉里的物品如何排列。我知道有一把锁，钥匙在哪里，以及如何插入和转动钥匙来锁柜子。我知道钥匙和锁的手感以及使用时发出的声音。钥匙上有一个小环，我知道如何用指甲撬开环来添加或取下钥匙。

想象一下在你家里从一个房间走到另一个房间。在每个房间里你能想到数百件事物，对于每一件物品你都能追溯一连串学到的知识。你也可以对你居住的城镇做同样的练习，回忆不同位置有哪些建筑、公园、自行车架和单独的树木。对于每一件物品，你都能回忆起与之相关的经历以及你如何与之互动。你知道的东西数量庞大，相关的知识链接似乎永无止境。

我们也学习许多高层概念。据估计，我们每个人大约认识四万个词。我们有能力学习口语、书面语、手语、数学语言和音乐语言。我们学习电子表单如何工作、恒温器做什么，甚至学习同理心或民主意味着什么——尽管我们对这些的理解可能各不相同。无论新皮层可能还做什么其他事情，我们可以确定地说，它学习了一个极其复杂的世界模型。这个模型是我们预测、感知和行动的基础。

通过运动学习

大脑的输入在不断变化，原因有二。

第一，世界本身会变化。例如，听音乐时，耳朵的输入快速变化，反映着音乐的流动。类似地，微风中摇曳的树木会带来视觉甚至听觉的变化。在这两个例子中，大脑的输入时刻在变，不是因为你在动，而是因为世界中的事物自己在运动和变化。
第二个原因是我们在运动。每次我们迈步、移动肢体、转动眼睛、倾斜头部或发出声音，感觉器官的输入都会改变。例如，我们的眼睛大约每秒做三次快速运动，称为眼跳（saccade）。每次眼跳，眼睛都会注视世界中的一个新点，从眼睛到大脑的信息完全改变。如果我们没有移动眼睛，这种变化就不会发生。

"The brain learns its model of the world by observing how its inputs change over time."

大脑通过观察其输入如何随时间变化来学习世界模型。没有其他学习方式。与计算机不同，我们不能把文件上传到大脑中。大脑学习任何东西的唯一途径是通过输入的变化。如果大脑的输入是静态的，就什么也学不到。

有些东西，比如旋律，可以不动身体就学会。我们可以完全静止地坐着，闭上眼睛，仅通过聆听声音如何随时间变化来学习一段新旋律。但大多数学习需要我们主动运动和探索。想象你进入一栋新房子，一栋你以前没去过的房子。如果你不动，感觉输入就不会有任何变化，你不可能学到关于这栋房子的任何东西。要学习一个关于房子的模型，你必须朝不同方向看，从一个房间走到另一个房间。你需要打开门、翻看抽屉、拿起物品。房子及其内容物大多是静态的，它们不会自己移动。要学习一栋房子的模型，你必须运动。

以一个简单的物品——电脑鼠标为例。要学习鼠标摸起来是什么感觉，你必须用手指在上面滑动。要学习鼠标看起来是什么样子，你必须从不同角度观察它，让眼睛注视不同位置。要学习鼠标能做什么，你必须按下按钮、滑开电池盖、或者在鼠标垫上移动它来看、感觉和听到发生了什么。

这就是所谓的感觉-运动学习（sensory-motor learning）。换句话说，大脑通过观察我们运动时感觉输入如何变化来学习世界模型。我们可以不动就学会一首歌，因为与我们在房子里从一个房间走到另一个房间的顺序不同，歌曲中音符的顺序是固定的。但世界的大部分不是这样的；大多数时候我们必须运动才能发现物体、场所和动作的结构。在感觉-运动学习中，与旋律不同，感觉的顺序不是固定的。当我进入一个房间时看到什么，取决于我把头转向哪个方向。当我握着咖啡杯时手指感觉到什么，取决于我把手指向上、向下还是向侧面移动。

每一次运动，新皮层都会预测下一个感觉将是什么。手指在咖啡杯上向上移动，我期待感觉到杯沿；手指向侧面移动，我期待感觉到把手。如果进入厨房时我把头转向左边，我期待看到冰箱；如果转向右边，我期待看到灶台。如果我把目光移向左前方的炉灶，我期待看到那个需要修理的坏了的点火器。如果任何输入与大脑的预测不匹配——也许我的配偶修好了点火器——那么我的注意力就会被吸引到预测错误的区域。这提醒新皮层，它关于世界那个部分的模型需要更新。

关于新皮层如何工作的问题现在可以更精确地表述为：由数千个几乎相同的皮层柱组成的新皮层，如何通过运动学习一个预测性的世界模型？

这就是我和我的团队着手回答的问题。我们相信，如果能回答这个问题，我们就能逆向工程新皮层。我们将理解新皮层做什么以及如何做到。最终，我们将能够建造以同样方式工作的机器。

神经科学的两条基本原则

在开始回答上述问题之前，还有一些基本概念你需要了解。首先，和身体的其他所有部分一样，大脑由细胞组成。大脑的细胞称为神经元（neuron），在许多方面与我们身体的其他细胞相似。例如，神经元有定义其边界的细胞膜和包含DNA的细胞核。然而，神经元有几个在身体其他细胞中不存在的独特属性。

第一，神经元看起来像树。它们有细胞膜的分支状延伸，称为轴突（axon）和树突（dendrite）。
树突分支聚集在细胞体附近，收集输入信号。
轴突是输出端，它与附近的神经元建立许多连接，但通常也会延伸很长的距离，比如从大脑的一侧到另一侧，或者从新皮层一直延伸到脊髓。
第二个不同之处是神经元产生脉冲（spike），也称为动作电位（action potential）。
动作电位是一种电信号，从细胞体附近开始，沿着轴突传播，直到到达每一个分支的末端。
第三个独特属性是一个神经元的轴突与其他神经元的树突建立连接。
这些连接点称为突触（synapse）。当沿轴突传播的脉冲到达突触时，它释放一种化学物质进入接收神经元的树突。根据释放的化学物质不同，它会使接收神经元更可能或更不可能产生自己的脉冲。

考虑到神经元的工作方式，我们可以陈述两条基本原则。这些原则将在我们理解大脑和智能的过程中扮演重要角色。

原则一：思想、观念和感知是神经元的活动

在任何时刻，新皮层中一些神经元在活跃地放电，一些则没有。通常，同时活跃的神经元数量很少，大约2%。你的思想和感知由哪些神经元在放电决定。例如，当医生进行脑部手术时，有时需要激活清醒患者大脑中的神经元。他们将一根微小的探针插入新皮层，用电流激活几个神经元。当他们这样做时，患者可能会听到、看到或想到某些东西。当医生停止刺激时，患者正在经历的一切就停止了。如果医生激活不同的神经元，患者就会有不同的思想或感知。

思想和体验始终是一组同时活跃的神经元的结果。单个神经元可以参与许多不同的思想或体验。你的每一个想法都是神经元的活动。你看到、听到或感觉到的一切也是神经元的活动。我们的心理状态和神经元的活动是同一回事。

原则二：我们所知的一切都存储在神经元之间的连接中

大脑记住很多东西。你有永久记忆，比如你在哪里长大。你有临时记忆，比如昨晚晚餐吃了什么。你还有基本知识，比如如何开门或如何拼写"dictionary"这个词。所有这些都通过突触——神经元之间的连接——来存储。

大脑学习的基本原理是这样的：每个神经元有数千个突触，将该神经元与数千个其他神经元连接起来。如果两个神经元同时放电，它们之间的连接就会加强。当我们学习某些东西时，连接被加强；当我们遗忘某些东西时，连接被削弱。这个基本思想由 Donald Hebb 在1940年代提出，今天被称为赫布学习（Hebbian learning）。

多年来，人们认为成年大脑中神经元之间的连接是固定的。学习被认为只涉及增加或减少突触的强度。这仍然是大多数人工神经网络中学习发生的方式。

然而，在过去几十年中，科学家发现在大脑的许多部分，包括新皮层，新的突触会形成，旧的突触会消失。每天，一个神经元上的许多突触会消失，新的突触会取代它们。因此，大部分学习是通过在之前没有连接的神经元之间形成新连接来实现的。遗忘则发生在旧的或未使用的连接被完全移除时。

我们大脑中的连接存储着我们通过经验学到的世界模型。每天我们经历新事物，通过形成新突触向模型添加新的知识片段。在任何时刻活跃的神经元代表着我们当前的思想和感知。

我们现在已经了解了新皮层的几个基本构建模块——我们拼图的一些碎片。在下一章中，我们将开始把这些碎片拼合在一起，揭示整个新皮层如何工作。