11.19 知识演算推理
知识的度量和知识在知识树上的显示分布提供了知识演算和基于知识的推理的数学基础。
给定模型 ℳ ,给定模型 ℳ 的信息系统 𝐴,这里 𝐴 是一个不可约非负矩阵。
令 𝑇 是信息系统 𝐴 的编码树,𝑇[ℳ] 是编码树 𝑇 确定的 𝐴
在 ℳ 中的知识树。
(1)对于 𝛼 ∈ 𝑇,知识 𝐾𝛼 = ⟨𝑃𝛼, 𝑄𝛼, 𝑀𝛼, 𝑅𝛼⟩[ℳ] 的知识量为:
𝒦𝑇(𝐴; 𝛼) = −𝑞𝛼
log 𝑉𝛼 .
𝑉𝛼−
(2)对 𝑀 ⊂ 𝑇,定义 𝑀 中模块的知识量为:
𝒦𝑇(𝐴; 𝑀) = − ∑ 𝑞𝛼
𝛼∈𝑀
𝛼≠𝜆
log 𝑉𝛼
𝑉𝛼−
𝑉𝛼
= − ∫ 𝑞𝛼 log
𝑀
.
𝑉𝛼−
定义 11.15(条件知识)对于 𝑀, 𝑁 ⊂ 𝑇,𝑁 在条件 𝑀 下的知识
量为:
𝒦𝑇(𝐴; 𝑁|𝑀) = − ∑ 𝑞𝛼
𝛼∈𝑁\𝑀
𝛼≠𝜆
log 𝑉𝛼
𝑉𝛼−
= − ∫ 𝑞𝛼
𝑁\𝑀
这里 𝑁\𝑀 是 𝑁 和 𝑀 的集合差。
log 𝑉𝛼 ,
𝑉𝛼−
基于知识的推理有很多有意义的问题,我们介绍几个简单的知识推理。
𝛼∗ = 𝑎𝑟𝑔𝑚𝑎𝑥{𝒦𝑇(𝐴 ; 𝛼)}.
𝛼∗ = 𝑎𝑟𝑔𝑚𝑖𝑛{𝒦𝑇(𝐴 ; 𝛼)}.
最大知识模块和最小知识模块可以为我们提供基于原理的注意力或自注意力机制。
定义 11.18(层谱抽象的知识)对于个体 𝑥,令 𝛿 是 𝑥 在编码树 𝑇 的码字,定义
𝑀𝑥 = {𝛼|𝜆 ⊂ 𝛼 ⊆ 𝛿}.
定义 𝑥 在 𝑇 上的层谱抽象的知识量为:
𝒦𝑇(𝐴; 𝑥) = 𝒦𝑇(𝐴; 𝑀𝑥).
𝑥∗ = 𝑎𝑟𝑔𝑚𝑎𝑥{𝒦𝑇(𝐴; 𝑀𝑥)},
𝑥 遍历所有个体。
𝑥∗ = 𝑎𝑟𝑔𝑚𝑖𝑛{𝒦𝑇(𝐴; 𝑀𝑥)}.
最大和最小知识层谱抽象也为我们提供了找到特别意义的个体提供了原理。
定义 11.21(领域知识)对于 𝛼 ∈ 𝑇,令 𝑇α 是 𝑇 中以 𝛼 为根
的子树,定义 𝛼 的领域知识量为:
𝒜𝑇(𝐴; 𝛼) = − ∑ 𝑞𝛽
𝛽∈𝑇𝛼
𝛽≠𝛼
𝑉𝛽
log
𝑉𝛽−
𝑉𝛽
= − ∫ 𝑞𝛽 log
𝑇𝛼
.
𝑉𝛽−
𝛼∗ = 𝑎𝑟𝑔𝑚𝑎𝑥{𝒜𝑇(𝐴; 𝛼)}.
𝛼∗ = 𝑎𝑟𝑔𝑚𝑖𝑛{𝒜𝑇(𝐴; 𝛼)}.
最大和最小知识领域提供了我们找到特别相关领域的原理。定义 11.24(最大知识推理)给定 𝑀 ⊂ 𝑇,找 𝑁∗ 满足
𝑁∗ = 𝑎𝑟𝑔𝑚𝑎𝑥{𝒦𝑇(𝐴; 𝑁|𝑀)},
这里 𝑁 是满足特定条件的模块构成的集合。同理有
定义 11.25(最小知识推理)给定 𝑀 ⊂ 𝑇,找 𝑁∗ 满足
𝑁∗ = 𝑎𝑟𝑔𝑚𝑖𝑛{𝒦𝑇(𝐴; 𝑁|𝑀)},
这里 𝑁 是满足一定条件的模块的集合。
最大和最小知识推理为我们提供了基于知识的推理原理。
基于知识的演算与推理建立了一个理论系统,为基于原理的知识推理理论奠定了基础。