< 上一个 | 内容 | 下一个 >

4.4.3 基于脑启发的心理揣测模型

与认知心理学和脑科学关系更紧密的是脑启发的心理揣测模型。在这个方向上,中科院自动化所曾毅团队取得了一系列研究进展。 Zeng 等人[8]借鉴心理揣测的多尺度神经可塑性机理,即相关脑区、脑


区功能及神经环路,提出类脑心理揣测脉冲神经网络模型。该模型实现了机器人的自我经验学习,并能够利用自我经验实现对他人信念及行为的揣测,使机器人可以通过错误信念任务,获得初步的心理揣测能力。该模型探索了自我经验、相关脑区和脑区间连接的成熟度,特别是抑制控制机制对心理揣测能力的影响,有助于从计算角度揭示心理揣测的神经机制。

Zhao 等人[9]在此研究的基础上,提出了多脑区协同的心理揣测脉冲神经网络模型,该模型由四个部分组成:视角采集模块(模拟 TPJ和额下回脑区功能)、策略推断模块(模拟 vmPFC 脑区功能)、动作预测模块(模拟dlPFC 脑区功能)和状态评估模块(模拟ACC 脑区功能),模型采用了模拟生物神经元的 LIF 神经元、网络的学习过程采用了与突触可塑性相关的R-STDP 方法、网络的连接是参考心理揣测各个脑区之间连接建立的。因此每个子模块的输出都是可解释的,训练过程也是受脑启发的。该模型可以区分并对不同类型的智能体进行揣测,并且基于揣测来预判他人未来的安全状态。最后将该模型应用到安全风险任务中,实验证明,具备心理揣测能力的智能体可以帮助他人避免安全风险。

心理揣测的心理状态往往是抽象的,难以直接观测和表征。因此, Zhao 等人[10]不显示地构建对他人的心理状态而是采用网络隐层表征他人的心理状态,进而预测他人行为。该方法中每一个智能体都有自己的决策网络以及心理揣测网络。心理揣测网络的输入是对环境的观测以及对他人行为的观测,隐藏层编码了智能体对他人内心状态的归因,输出层表征了对他人行为的预测。心理揣测的结果可以丰富智能体对当前状态的表征从而帮助提升多智能体合作的性能和效率,并提高智能体在竞争中的竞争力。同时模型还借鉴大脑中 TPJ 模块可以区分自己和他人的功能,包含了存储自身经验和对他人观测的模块,以便模拟智能体使用不同信息进行决策。实验结果表明,在自身经验的


帮助下智能体更容易对陌生的智能体产生准确的判断;而随着智能体之间交互变多,智能体通过对方的历史信息来推测对方会更有效率。

格拉斯哥大学的 Roth 等人[50]认为 Zeng 等人[8]提出的脑启发的心理揣测模型同认知双重过程方法一致,区分了更自动、快速、更少受控制的过程和更刻意、更缓慢和有意识的过程,并与区分内隐和外显的心理揣测模型一致。因此,借鉴类脑心理揣测模型[8],特别是该模型提出的四条通路:自我经验学习通路、动机理解通路、自我信念推理通路和他人信念推理通路,Roth 等人提出了一项新的心理学实验范式,并在 60 名人类被试上进行了该实验,实验结果进一步证明了脑启发心理揣测模型的有效性和合理性,有助于进一步揭示心理揣测的神经机制。两项工作将人工智能和心理学在心理揣测方面的研究紧密结合在了一起,在计算建模和心理学实验间形成了良好互动。