< 上一个 | 内容 | 下一个 >

7.2.3 合作博弈在多智能体系统中的应用

在某些应用中,智能体需要合作并共享他们的联合工作价值。这使得我们在某些情况下,可以利用合作博弈的结果来设计智能体。在本节中,我们首先介绍了一个通用的应用—任务分配问题,面向这个应用领域,许多多智能体系统的文献使用合作博弈对其进行研究。然后,我们陈述合作博弈在多智能系统中其他领域的一些应用。


7.2.3.1 任务分配问题

任务分配问题可以通过联盟形成问题轻松表示:局中人联盟负责执行任务(或任务的子集),任务可能需要多个局中人才能执行。一方面,执行复杂任务可能需要互补的专业知识,许多方法假设没有单个局中人有执行复杂任务所需的全部专业知识[34] -[37] 。在一般情况下,任务可以分解为子任务,局中人能够执行子任务中的一部分任务。另一方面,所有局中人都具备执行任务所需的必要能力或专业知识,但它们本身没有足够的资源来执行任务。例如,机器人有能力在工厂移动物体,但是需要多个机器人来移动重箱子[34] [38]

一般的任务分配问题可以描述如下:一个由局中人组成的联盟来执行一个复杂的任务,联盟中的每个局中人在任务完成中扮演一个角色(他们可能都有相同或互补的角色)。任务完成后将获得回报。与任务完成相关的成本取决于联盟成员。联盟的价值是完成任务的净收益(回报减去成本)。因此,任务分配问题可以看作是一个联盟形成问题,其中联盟的价值仅取决于其成员。

目前,针对该问题存在一系列研究:Shehory Kraus[34] 研究了 任务之间存在偏序关系的任务分配博弈。Kraus 等人[35] -[36] 考虑了 成本和时间相关联的模型。Abdallah Lesser[38] 面向任务以顺序到 达且局中人存在层级关系的场景,学习论方法会使得任务分配更高效。从计算复杂性角度审视任务分配问题,当每个局中人仅允许承担一项 任务时,该问题类似于集合划分问题;当每个局中人可以承担多项任 务时,任务分配问题和集覆盖问题相似。无论是哪种情况,这类问题 都被证明是 NP-困难的。

7.2.3.2 其他领域

联盟形式的智能体也被广泛地应用在许多其他应用领域,如信息收集(Information Gathering)、机器学习等。在信息收集[39] [40] 中,一个智能体与本地数据库相关联。当智能体形成联盟时,为了信息查


询,联盟中的所有智能体都必须合作:成员分享一些他们的私有数据,例如依赖关系信息。如果一个智能体不合作,它将无法访问某些信息 模式,这些信息模式只有联盟成员才可以使用。智能体联盟形成可以 视为一个合作博弈的实例,其中每个智能体都试图最大化其预期效用。针对该问题,Klusch Shehory[39] [40] 使用双边Shapley 值来确定支 付分配和提出了一个以核为导向的解方案。

在机器学习中,合作博弈的知识可以用于指导不同分类器的结果组合,旨在提高分类的准确性。Aknine Caillou[41] 以及 Plaza Ontañón[42] 将这一思想应用于联盟形成设置中。例如,在 Plaza Ontañón 的工作中,分类器可以形成委员会(即联盟)来对新物种进行分类。每个分类器都有自己的专业知识、案例集,且使用基于情况的推理解决分类问题。在他们的工作中,Plaza Ontañón 展示了如何决定何时需要联盟以及如何选择分类器形成联盟。