7.2.3 合作博弈在多智能体系统中的应用

在某些应用中，智能体需要合作并共享他们的联合工作价值。这使得我们在某些情况下，可以利用合作博弈的结果来设计智能体。在本节中，我们首先介绍了一个通用的应用—任务分配问题，面向这个应用领域，许多多智能体系统的文献使用合作博弈对其进行研究。然后，我们陈述合作博弈在多智能系统中其他领域的一些应用。

7.2.3.1 任务分配问题

任务分配问题可以通过联盟形成问题轻松表示：局中人联盟负责执行任务（或任务的子集），任务可能需要多个局中人才能执行。一方面，执行复杂任务可能需要互补的专业知识，许多方法假设没有单个局中人有执行复杂任务所需的全部专业知识 [34] -[37] 。在一般情况下，任务可以分解为子任务，局中人能够执行子任务中的一部分任务。另一方面，所有局中人都具备执行任务所需的必要能力或专业知识，但它们本身没有足够的资源来执行任务。例如，机器人有能力在工厂移动物体，但是需要多个机器人来移动重箱子 [34] [38] 。

一般的任务分配问题可以描述如下：一个由局中人组成的联盟来执行一个复杂的任务，联盟中的每个局中人在任务完成中扮演一个角色（他们可能都有相同或互补的角色）。任务完成后将获得回报。与任务完成相关的成本取决于联盟成员。联盟的价值是完成任务的净收益（回报减去成本）。因此，任务分配问题可以看作是一个联盟形成问题，其中联盟的价值仅取决于其成员。

目前，针对该问题存在一系列研究：Shehory 和 Kraus[34] 研究了任务之间存在偏序关系的任务分配博弈。Kraus 等人[35] -[36] 考虑了成本和时间相关联的模型。Abdallah 和 Lesser[38] 面向任务以顺序到达且局中人存在层级关系的场景，学习论方法会使得任务分配更高效。从计算复杂性角度审视任务分配问题，当每个局中人仅允许承担一项任务时，该问题类似于集合划分问题；当每个局中人可以承担多项任务时，任务分配问题和集覆盖问题相似。无论是哪种情况，这类问题都被证明是 NP-困难的。

7.2.3.2 其他领域

联盟形式的智能体也被广泛地应用在许多其他应用领域，如信息收集（Information Gathering）、机器学习等。在信息收集 [39] [40] 中，一个智能体与本地数据库相关联。当智能体形成联盟时，为了信息查

询，联盟中的所有智能体都必须合作：成员分享一些他们的私有数据，例如依赖关系信息。如果一个智能体不合作，它将无法访问某些信息模式，这些信息模式只有联盟成员才可以使用。智能体联盟形成可以视为一个合作博弈的实例，其中每个智能体都试图最大化其预期效用。针对该问题，Klusch 和 Shehory[39] [40] 使用双边Shapley 值来确定支付分配和提出了一个以核为导向的解方案。

在机器学习中，合作博弈的知识可以用于指导不同分类器的结果组合，旨在提高分类的准确性。Aknine 和 Caillou[41] 以及 Plaza 和 Ontañón[42] 将这一思想应用于联盟形成设置中。例如，在 Plaza 和 Ontañón 的工作中，分类器可以形成委员会（即联盟）来对新物种进行分类。每个分类器都有自己的专业知识、案例集，且使用基于情况的推理解决分类问题。在他们的工作中，Plaza 和 Ontañón 展示了如何决定何时需要联盟以及如何选择分类器形成联盟。

< 上一个 | 内容 | 下一个 >