< 上一个 | 内容 | 下一个 >

4.4.1 基于贝叶斯的心理揣测模型

基于贝叶斯的心理揣测模型是最具代表性的一类心理揣测模型,麻省理工学院的 Goodman 等人[39]建立了两个贝叶斯模型,这两个模型都支持预测和解释。简单模型中 Sally 的信念只与玩具的位置有关,而复杂模型中 Sally 的信念不仅与玩具位置有关还与她对玩具的视觉感知相关,即 Sally 是否能够看到玩具移动。这一区别使得简单模型


无法通过错误信念任务,而复杂模型会成功。Bayesian 推理通常是通过逆强化学习(Inverse Reinforcement LearningIRL)进行的。正如 Jara-Ettinger[40]所描述的那样,“通过模拟具有假设信念和欲望的 RL模型来预测其他人的行动,而通过反演该模型来实现心理状态推断”。

类似于这种想法,麻省理工学院的 Baker 等人[41]提出了一个贝叶斯心理揣测模型(Bayesian Theory of MindBToM),这个工作将 belief建模为智能体在一时刻为某一状态的概率,以此为基础构建的动态贝叶斯网络(dynamic Bayes netDBN)可以预测环境中智能体的目标。 Baker 的工作将心理揣测中抽象的名词,例如信念(belief)、想法

desire)进行符号化,使得模型的可解释性更强。

除此之外,Baker IRL 的思想与部分可观察马尔可夫决策过程 (POMDPs)结合用于建模心理揣测模型,被揣测对象在环境中的行动是可观察的,并以此为后验来对被揣测对象的信念和目标进行逆向推断。该模型可以根据智能体在空间中的移动方式,来推断它的信念、期望和知觉。在两个心理学实验中,该模型获得了和人类被试相似的实验结果。实验结果表明,贝叶斯心理揣测模型可以根据他人的行为揣测他人的信念、期望和知觉,以及用他人的想法和行为揣测环境的状态。在这种基于概率(贝叶斯)方法建模心理揣测的过程中,逐渐衍生对心理揣测进行递归建模的思路[42-44]

以两个人的场景为例,递归推理可以通过下图描述:拥有零阶心理揣测(图 4-3)能力的智能体可以根据对另一个人的行为观测生成一个概率分布以作为它对另一个智能体信念推断的依据。拥有一阶心理揣测(图 4-4)能力的智能体同时具有推测他人零阶信念和一阶信念的能力。一阶信念是指智能体认为另一个人如何推断自己的概率分布。然后拥有一阶心理揣测的智能体会将其一阶预测与零阶信念进行集成,并将该集成信念用于最终决策。预测对代理行为的影响程度由它的一阶置信度决定,如果预测正确则增加置信度,反之则降低。这


样的贝叶斯心理揣测模型普遍需要很高的计算成本来形成和维持信 念。因此,模型通常针对特定的场景进行优化,比如石头剪刀布、或 者一些假设性较强的特定任务中。由于心理揣测是智能体思考的过程,因此心理揣测的实验会伴随着智能体的决策,而要单一研究心理揣测 模型就需要保证智能体的决策是完全正确的。以上的这些研究确实在 心理揣测建模方面取得了一些进展,但是对于解决复杂的或者实际应 用问题仍过于理想化。

7c256453aa1a67a1503190418656e1f

图 4-3 一个零阶心理揣测的例子[44]


d22bdd0c0edbe027adfe2dc7b46db92


图 4-4 一个一阶心理揣测的例子[44]


麻省理工学院的 Lee 等人[45]定义了一个用于人机交互的非语言交流的双重计算框架。他们使用贝叶斯心理揣测方法来模拟讲故事时的交互作用。讲述者利用声音线索来影响和推断听者的注意状态,将其作为一个部分可观测马尔可夫决策规划问题进行计算。听者通过自己的反应传达注意力,将其作为一个动态贝叶斯网络计算。通过人机交互实验证明模型在注意力识别和传达的有效性。爱丁堡大学的 Patacchiola Cangelosi[46]提出了一种基于信任和心理揣测的发展认知架构,该架构受心理和生物学的启发,由演员-评论家框架和贝叶斯网络组成,这些模块分别对应于大脑中用于心理揣测的脑区。最后,他们用 iCub 仿人机器人进行了两个心理学实验,结果与儿童的实验数据一致,有助于揭示儿童和机器人基于信任的学习机制。