13.16 博弈的收益原理
现实世界博弈的一个重大行动必然会诱导出有很多玩家参与的博弈系统,在其中每个玩家都采取了各种策略。
定义 13.15(博弈行动诱导事件关系图)令 𝑎 是一个自我意识体的重大行动。行动 𝑎 诱导事件关系图指由行动 𝑎 诱导的其它玩家的相互作用关系图。令 𝐺𝑎 = (𝑉, 𝐸) 是行动 𝑎 诱导的事件关系图,这里:
(1)𝑉 是行动 𝑎 及行动 𝑎 诱导的其它事件构成的集合;
(2)(𝑥, 𝑦) ∈ 𝐸 表示事件 𝑥 对事件 𝑦 有直接影响;
(3)对给定有向边 (𝑥, 𝑦) ∈ 𝐸,有一个交互分值 𝑓(𝑥, 𝑦) 表示
𝑥 对 𝑦 的直接影响。
诱导事件关系图 𝐺𝑎 的意义是:
命题 13.2(代价与收益)对于每一个针对 𝑎 采取行动的玩家 𝑥,
𝑥 的代价和收益均嵌入在诱导事件关系图 𝐺𝑎 中。
定义 13.16(收益链)令 𝑎 是一个行动,𝑥 是一个玩家,𝑋 是玩家 𝑥 针对行动 𝑎 采取的行动的集合,定义:
(1)𝑋 的一个代价链是 𝐺𝑎 中的一条路径,它决定着 𝑋 的代价;
(2)𝑋 的一个收益链是 𝐺𝑎 中的一条路径,它决定着 𝑋 的收益。
定义 13.16 揭示了:一个玩家的代价和收益都是由诱导事件关系图 𝐺𝑎 中的一些路径来决定的,因此极小化代价就是要阻断代价链,极大化收益就是要强化、扩大和增加收益链。
命题13.2 揭示了任何一个玩家都有可能由于行动 𝑎 而付出代价;任何一个玩家也都有可能由于行动 𝑎 诱导的事件获得利益。
命题 13.2 还揭示了发动行动 𝑎 的玩家肯定要付出代价,但是未必最终获得收益。
进一步,命题 13.2 揭示了现实世界博弈的一些重要性质,例如:
(1)现实世界上的任何一个重大行动或事件都可能使有些玩家付出代价,也都有可能使有些玩家获得利益。
因此,高明的玩家就是针对重大事件做出正确的选择,在正确的时机采取恰到好处的行动,在不该行动的时候,什么也不做。有趣的
是,有的时候,什么都不做就赢了。有的时候是,做了很多,最后输了。
(2)行动 𝑎 诱导的事件关系图 𝐺𝑎 越大、越复杂,发起行动 𝑎
的玩家赢的机会就越小。
如果行动 𝑎 诱导的事件关系图 𝐺𝑎 超出行动 𝑎 发起者的预料,那么发起行动 𝑎 的玩家就已经输了。因为它发起的行动所产生的结 局不是它能控制、甚至预知的。