< 上一个 | 内容 | 下一个 >

3.4.2 分类

博弈论被分成两大类,合作与不合作。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

第一种是智能体之间完全合作的场景,表示为多智能体具有一个相同收益函数的博弈形式,成为团队博弈,这也是合作型多智能体强化学习的基础研究框架。

第二个场景则为智能体之间的完全竞争关系,典型形式为零和博弈,智能体之间 具有零和收益关系。第三种场景是一般和博弈,对这种场景 Nash 均衡是标准的解形式。下面则对于基本的博弈形式分别进行介绍。在 1928 年,冯·诺依曼已经奠定了非合作

博弈论。同时,在 1951 年,纳什提出了另一个概念,作为概括冯·诺依曼理论的基础。在他的文章中,双人游戏的解决方案对于战略的最低要求就是候选人,作为一个对战 略的最低要求是对两个人的游戏解决方案的候选人,他建议每个策略都要给对方最好 的答复。是为纳什均衡理论。