< 上一个 | 内容 | 下一个 >

7.1.1 纳什均衡

在研究纳什均衡之前,我们必须首先给出博弈的数学定义,在此着重关注策略型博弈。

定义 1 ( 策略型博弈) 策略型博弈 可表示为一个三元组

〈𝑁, (𝑆𝑖)𝑖∈𝑁, (𝑢𝑖)𝑖∈𝑁,其中:

∎ 𝑁 = {1, 2, … , 𝑛}为参与者的集合,包含参与者1, 2, … , 𝑛


∎ 𝑆1, 𝑆2, … , 𝑆𝑛分别是参与者1, 2, … , 𝑛的策略集合;即𝑆1代表参与者1的策略集,𝑆𝑛代表参与者𝑛的策略集;

∎ 𝑢𝑖: 𝑆1 × 𝑆2 × … × 𝑆𝑛 → ℝ(其中,𝑖 = 1, 2, … , 𝑛)是一组映射,通常称为效用函数或收益函数。

在此,策略有时也被称为行动action)或纯策略pure strategies)。

我们使用笛卡尔积𝑆1 × 𝑆2 × … × 𝑆𝑛来表示策略,记为𝑆。如果参与者

𝑖根据某个给定的概率分布选择𝑆𝑖中的策略,则得到混合策略,又称随机策略。

定义 2(混合策略)鉴于参与者𝑖及其纯策略集𝑆𝑖的给定,其混合

策略mixed strategy)或称随机策略randomized strategy𝜎𝑖可定义为𝑆𝑖上的概率分布。具体而言,𝜎𝑖: 𝑆𝑖 → [0,1]是一个映射,它为每个纯策略𝑠𝑖 ∈ 𝑆𝑖分配一个概率值,满足以下条件:

∑ 𝜎𝑖(𝑠𝑖) = 1.

𝑠𝑖∈𝑆𝑖

假设𝑆𝑖 = {𝑠𝑖1, 𝑠𝑖2, … , 𝑠𝑖𝑛},则参与者𝑖的所有混合策略形成的集合,可以表示为集合𝑆𝑖上所有可能的概率分布的集合,即:

𝑚

Δ(𝑆𝑖) = {(𝜎𝑖1, … , 𝜎𝑖𝑚) ∈ ℝ𝑚: 𝜎𝑖𝑗 ≥ 0 对于𝑗 = 1, … , 𝑚∑ 𝜎𝑖𝑗 = 1}.

𝑗=1

集合Δ(𝑆𝑖)被称为𝑆𝑖混合扩展mixed extension)。我们定义M =

Δ(𝑆1) × Δ(𝑆2) × … × Δ(𝑆𝑛)混合策略集合

现在我们已经为纳什均衡的定义做好了准备。

定义 3 (纯策略纳什均衡) 对于给定的策略型博弈 Γ =

〈𝑁, (𝑆𝑖), (𝑢𝑖)〉及其策略组𝑠∗ = (𝑠∗, 𝑠∗, … , 𝑠∗),如果满足以下条件:

1 2 𝑛

𝑢𝑖(𝑠, 𝑠 ) ≥ 𝑢𝑖(𝑠𝑖, 𝑠 ), ∀𝑠𝑖 ∈ 𝑆𝑖, 𝑖 = 1,2, … , 𝑛.

𝑖 −𝑖 −𝑖

𝑠Γ的一个纯策略纳什均衡(简记为 PSNE)。

我们现在提供纯策略纳什均衡(PSNE)的另外一种描述方法。定义 4 ( 最优反应对应) 对于给定的策略型博弈Γ =


〈𝑁, (𝑆𝑖), (𝑢𝑖)〉,参与者𝑖最优反应对应best response correspondence

是映射𝑏𝑖: 𝑆−𝑖 → 2𝑆𝑖,其定义如下:

𝑏𝑖(𝑠−𝑖) = {𝑠𝑖 ∈ 𝑆𝑖: 𝑢𝑖(𝑠𝑖, 𝑠−𝑖) ≥ 𝑢𝑖(𝑠, 𝑠−𝑖), ∀𝑠 ∈ 𝑆𝑖}.

𝑖 𝑖

换句话说,给定所有其他参与者的策略组𝑠−𝑖𝑏𝑖(𝑠−𝑖)给出了由参与者𝑖的所有最优反应策略组成的集合。

𝑠 ∈ 𝑏𝑖(𝑠 ), ∀𝑖 = 1,2, … , 𝑛.

𝑖 −𝑖

定义 5 ( 混合策略纳什均衡) 对于给定的策略型博弈Γ =

〈𝑁, (𝑆𝑖), (𝑢𝑖)〉以及其混合策略组(𝜎∗, 𝜎∗, … , 𝜎∗),若满足对于所有𝑖 ∈ 𝑁

1 2 𝑛

𝑢𝑖(𝜎, 𝜎 ) ≥ 𝑢𝑖(𝜎𝑖, 𝜎 ), ∀𝜎𝑖 ∈ Δ(𝑆𝑖).

𝑖 −𝑖 −𝑖

(𝜎∗, 𝜎∗, … , 𝜎∗)是一个混合策略纳什均衡mixed strategy Nash

1 2 𝑛

equilibrium)。

定义最优反应函数best response functions𝑏𝑖(∙)如下:

𝑏𝑖(𝜎−𝑖) = {𝜎𝑖 ∈ Δ(𝑆𝑖): 𝑢𝑖(𝜎𝑖, 𝜎−𝑖) ≥ 𝑢𝑖(𝜎, 𝜎−𝑖), ∀𝜎 ∈ Δ(𝑆𝑖)}.

𝑖 𝑖

给定𝜎−𝑖𝑏𝑖(𝜎−𝑖)是参与者𝑖的所有混合策略构成的集合,其中每

个混合策略都是他针对其他参与者选择𝜎−𝑖行为的最优反应。因此,显然,混合策略组(𝜎∗, 𝜎∗, … , 𝜎∗)是一个纳什均衡当且仅当:

1 2 𝑛

𝜎 ∈ 𝑏𝑖(𝜎 ), ∀𝑖 = 1,2, … , 𝑛.

𝑖 −𝑖

由定义可知,当博弈处于纳什均衡状态下,任意玩家无法通过单独改变自身的策略来获得更多的收益。

由于纳什均衡的计算是 PPAD-complete 的,因此,除了严格定义的纳什均衡外,还存在一种实际中经常被分析的近似纳什均衡。

定理 6 𝜺-纳什均衡) 对于给定的策略型博弈〈𝑁, (𝑆𝑖), (𝑢𝑖)〉以及

一个策略组,给定实数𝜀 > 0,若对于所有𝑖 ∈ 𝑁

𝑢𝑖(𝜎, 𝜎 ) ≥ 𝑢𝑖(𝜎𝑖, 𝜎 ) − 𝜀, ∀𝜎𝑖 ∈ Δ(𝑆𝑖).

𝑖 −𝑖 −𝑖

(𝜎, … , 𝜎)称为该博弈的一个𝜺-纳什均衡𝜀-Nash equilibrium)。

1 𝑛