汪小京：将神经元变为数学模型和算法，在人脑和 AI 间架起桥梁_热推荐

图片来源@天桥脑科学研究院官网

大脑是宇宙中最复杂的系统。人们一直试图揭秘大脑的内在机理，但囿于技术和方法的限制，进展始终有些缓慢。如今，人工智能技术的到来给脑科学研究带来了全新的机遇。

6月21日，天桥脑科学研究院（Tianqiao and Chrissy Chen Institute，TCCI）和neurochat神聊共同发起了第四届TCCI-neurochat神聊在线学术会议。会议首日，纽约大学汪小京教授作题为“Theoretical Neuroscience in the age of Artificial Intelligence”主旨报告，从理论神经科学的角度，分享了人工智能应如何与神经科学相结合来推动神经科学的研究。

【资料图】

所谓理论神经科学或者计算神经科学（Theoretical/Computational Neuroscience），是利用数学理论来理解大脑是如何工作的。如同理论物理之于物理学，理论神经科学在大脑研究中也扮演着重要的角色，与实验研究相辅相成。仅仅通过实验，我们可能无法真正了解大脑如何在多个不同层面上运转。理论神经科学可以将神经元和神经网络转化为数学模型和算法，在脑科学和AI之间架起桥梁。随着实验工具的进步和大数据的出现，进行理论研究和建模显得尤为必要。

AI难以企及的脑功能

当下AI领域的技术革命约始于2012年。当时，杰弗里·辛顿（Geoffrey Hinton）的研究小组证明了深度神经网络可以执行视觉对象识别任务。众所周知，不同部位的皮层对应不同的功能。深度神经网络的不同层级可以映射到大脑的V1、V2、V4等区域。但眼睛上方的前额叶皮层（prefrontal cortex，PFC）直到现在也没有被研究透彻。人们也没有找到它的功能在当下的机器系统中的对应关系。

这个仍待阐明的PFC区，对各种认知功能都非常重要，例如工作记忆和决策。何为工作记忆？它是大脑内部维持和处理信息的能力，使大脑可以专注于内在，不被环境所役使。而决策则是指，人们如何在不确定性中做出选择。

通常情况下，在实验室中可以使用延迟依赖性任务研究工作记忆。比如，先给猴子看食物的位置，然后设置一个5或10秒的延迟阶段。在这段时间里，猴子必须牢牢记住食物是在左边还是在右边。延迟结束后，猴子会根据记忆来检索食物，而不是基于直接的感官刺激（食物本身）。上世纪70年代早期，人们使用单细胞记录和电刺激发现，在延迟阶段PFC单个细胞持续活跃。这个神经元在刺激之前并不活跃，它甚至没有对刺激作出反应，但却在延迟阶段持续活跃，并且随着延迟时间加倍而加倍。这就是所谓的刺激选择持续活动（stimulus-selective persistent activity）。

▷图注：延迟依赖性任务。图源：汪小京教授提供

对于决策的研究，有一个简单且巧妙的实验——双选项强迫选择（two-alternative forced choice）。猴子被训练注视屏幕上的一个点，并在点消失后做出决策：判断点的运动是朝左还是朝右。猴子需要通过眼动来表达其决策。诀窍在于，在任何给定的试验中，点移动方向的比例是可控的，这个比例被称为一致性（coherence）或运动强度（motion strength）。如果所有的点都向一个方向移动，那么就很容易做出决定。如果只有50%的点向同一方向运动，另外50%的点则是随机移动的，这就有点难以抉择了。如果只有5%的一致性，甚至是0%呢？这时候做出主观判断是非常困难的。单细胞生理学研究发现，神经元活动的持续递增（ramping activity）发生在几毫秒间。这种瞬时的剧烈活动是神经元整合信息的一种机制，通过积累关于不同选择方案的证据，做出主观判断。

汪小京教授通过这两个实验例子，直击了最复杂问题的内核。正如著名心理学家唐纳德·赫布（Donald Hebb）所说的那样：“要用一种中枢神经机制来解释刺激和反应之间的延迟的话，它似乎与思维的特征不谋而合。”当我们思考时，不是由直接的外部刺激所驱动，而是大脑内部的一种行为。延迟活动，则是内部神经元群体活动的具体实例。

然而，人们尚不清楚决策或选择的生物基础，而AI系统也没有这种能力。诚如诺姆·乔姆斯基（Noam Chomsky）所言：“一旦涉及意志或决定或理由或行动选择的来源问题，人类科学就陷入了迷茫。”

基于生物学进行建模

即便真实的生物过程如此复杂，我们可以用相对简单的行为范式，尝试了解跨层次的机制。

在物理学单摆实验中，如果空气中存在摩擦力，摆锤的幅度会越来越小，摆幅随时间呈指数式衰减。神经元的放电，亦是如此，会随着时间的推移而衰减（时间常数为10毫秒）。要想在工作记忆中获得持续的活动，就需要解决这一问题。为此，汪教授提出了一个大胆的假设：回响（reverberation）。也就是说，如果一组神经元相互激发，那么即使输入消失，它们仍然可以持续活动。在灵长类动物PFC的第二三层，有强大的水平连接，也为这一假设提供了结构基础。

为了验证这一假设，汪教授化繁为简，构建了一个只有两个动态变量的系统，展示了如何将随机点、感知决策和工作记忆结合起来进行判断和选择。

这个模型有两个选择性发放神经元群体——a和b。神经元群体内部发生回响，而两个群体之间的兴奋选择性要弱得多。同时，它们通过抑制性神经元进行竞争，最终产生一个赢家。而这，就是系统的选择。系统的选择是由运动强度和对a组和b组的相对输入决定的。当输入消失时，选择信号在整个延迟期是自我维持的。这个模型可以解释工作记忆和决策的基本过程。

▷图注：（左）双选项强迫选择；（右）慢回响动力系统。图源：汪小京教授提供

并且，这个模型是跨层级的。以反应时间作为运动强度的函数，会发现，运动强度较低时，任务越困难，做出决定所需的时间就越长。就像在日常生活中，要做一个艰难的选择时，我们通常需要很长的时间来考虑不同的选择。而这一点在猴子的实验中也有体现。这也阐明了为什么循环神经回路的动力学可以解释行为。

同时，汪教授从细胞分子角度提供了一些洞见。比如，慢速时间积分主要由NMDA受体介导的兴奋性回响实现。NMDA受体对于决策和工作记忆非常重要，这在猴子实验中已经得到测试和确认。如果找到一种药物来减少或消除NMDA的信号，那么神经元活动就会结束。

如果以自我维持状态、内部状态为反复激活强度的函数，并将这些状态称为一个参数，则会发现：在这个模型中，当参数高于一个阈值时，会出现一系列刺激选择性的、持久性的状态。这些状态包括工作记忆中的不同记忆项目。这种状态的出现可以解释为动态系统中的分岔，即参数的分级变化导致了不同的功能和能力。这一观点对于循环神经回路非常重要，并且在多区域、大规模的大脑系统中也有应用。

▷图注：工作记忆和决策中足够强的循环连接。图源：汪小京教授提供

在此基础上，我们可以借助机器学习建立一个近似生物学上的神经回路，用于执行20个不同的任务，比如可以涉及工作记忆、决策、分类、多感官整合、延迟采样、延迟分类等等。一旦网络成功地执行了所有微小的任务，就可以打开“黑匣子”进行分析，提出自己的问题，分析新的回路、神经群体的动态。神经元的活动可通过任务差异来衡量；神经元之间的相互作用和组织方式可以利用聚类分析来厘清。

然而，即便我们设计出类似PFC的回路，可以基于规则灵活地指导行为，也不应止步于此。我们有必要超越目前为止所描述的局部回路建模。因为，事实上，任何一种功能都涉及多个脑区，不仅仅是PFC，还有后顶叶皮层，甚至还可能有一些超级皮层结构。

从局部网络到大脑系统

大脑不同区域的互动存在非常强的循环性，作为一位理论家，汪教授表示，仅将它们之间的反馈连接定性地勾勒出来远远不够，他需要数字这种清晰明确的描述。而近十年内，得益于科技的发展，利用收集数据绘制区域间有向加权连接矩阵（directed and weighted connection matrix）成为可能。

在猕猴的皮层中，如果用直方图表示两个区域有向连接的权重，会发现多个区域的直方图呈对数正态分布。而任意一对区域的权重与布线距离（wiring distance）呈指数分布。这意味着我们不能用传统的图形描述皮层网络，因为图形描述是顶层逻辑的，并没有实现这种特殊的嵌入，无法体现皮层间的特殊关系。汪教授的团队创造了一类新的数学模型，这些模型是专门为特殊嵌入而设计的，可以用来研究真实的皮层网络。

▷图注：（左）图形描述；（右）不同区域的有向连接权重直方图以及权重与布线距离直方图。图源：汪小京教授提供

构建大型皮层模型时，我们需要对每个区域进行数学建模。不同的区域可能需要使用不同的数学模型。因此，我们需要从制定科学问题开始，并根据问题建立相应的模型。

在神经科学中，有一个公认的原则是存在皮层柱（cortex column）。这是由一组垂直排列的神经元组成的柱状结构，这些神经元具有相似的功能和结构特征。因此，存在一个重复了很多次的局部回路单元，在啮齿类动物、猴子和人类中，这个局部回路都是差不多的。但是，即使在相同的局部回路中，也存在数量上的差异，这将导致质变，即功能和能力的不同。因此，在建立模型时，需要考虑数量上的差异。

汪教授展示了在大规模系统中，数量差异的影响。以树突棘数量作为层级位置的函数，可以观察到每个细胞树突棘的数量系统性地增加了。这种微观梯度显示了不同区域里神经元的兴奋强度之间的关系。而在前段时间发表于《自然·神经科学》的论文中，汪教授则研究了猕猴皮层神经递质受体的表达梯度，如多巴胺受体和5-羟色胺受体，发现了一个皮层层级，受体在高层级的皮层区域具有更高密度、更大树突和较少髓鞘。这是用数学模型量化生物特性变化的又一实例。

▷图注：一种沿锥体细胞基底树突棘层级测量神经元突触输入的方法。图源：汪小京教授提供

除了数量上有层级外，时间常数也具有层级。不同区域的活动发生的时间尺度存在差异，其中一些区域的时间常数较短，而其他区域的时间常数较长。比如，视觉网络运行得非常快，当看电影的时候，感官输入一直在变化，时间常数必须非常短，以快速反应。而在决策时，神经元活动持续增加，这意味着时间常数必须非常长。这对于工作记忆和决策等认知过程具有重要意义。

汪教授还表示，通过对孤立区域的分析，可以发现区域间的连接不仅仅是局部的，而是长距离的，这种连接形成了分叉空间。大脑皮层大规模模型的建立过程，既包括线性梯度的添加，也需要对时间常数的分析。层级结构和时间常数可以帮助我们理解大规模动力学和功能的影响。

最后，汪教授强调，不是所有的神经回路都是一样的。像PFC这样的认知神经回路，它能够同时进行工作记忆和决策。从AI角度来看，这是最值得思考的问题。

写在最后

神经科学是一个复杂而迷人的领域，本次主旨报告以大量计算神经科学的例子为引，由表及里，发现隐藏在数据中的规律和趋势，层层剥开神经网络的运作方式。汪教授基于优雅的物理、严谨的数学，讲述了如何进行精细的生物学研究，内容深入浅出，发人深思。

标签：