11.12 局部观察学习
局部观察实现了:
(1)个体的观察
(2)个体之间的直接关系的观察。
一个个体由一些数据来表示,个体之间的直接关系由表示直接相互作用的个体的数据来定义。
因此,局部观察的结果就是数据。学习模型已经为局部观察学习建立了数学原理。同样,学习模型也为全局学习提供了数学原理。
大数据是 21 世纪的一个新现象,大数据分析已经成为一个重要的研究方向。然而,现有的数学并没有为数据分析提供一个可解释的原理。
根据我的学习模型,可以建立大数据分析的数学原理。 大数据分析的实质是:基于数据的知识发现和规律揭示。
大数据的知识在哪里?大数据的规律在哪里?我的回答是:大数据的知识存在于数据的关系之中,大数据的规律存在于数据的关系之中。
因此,数据的知识与规律均存在于数据及其关系构成的系统中。知识和规律背后的数学基础是信息,因此,解码嵌入在数据系统
中的信息是大数据知识发现和大数据规律揭示的数学原理。进一步,我提出如下的数据分析模型。
定义 11.6(大数据分析模型)令 ℬ 是一个大数据,它的分析如下进行:
1.(知识与规律)假设 𝐾 是 ℬ 的知识,𝐿 是 ℬ 的规律,𝐾 和
𝐿 是客观存在的,但是我们并不知道他们具体是什么。
2.(观察)观察数据之间的直接关系,构造初始数据系统 𝐴0,它是一个非负矩阵。
3.(生成策略)应用一个生成策略 𝐺 于 𝐴0 ,生成一个信息系统 𝐴,即:
𝐺(𝐴0) = 𝐴,
使得 𝐴 是一个不可约非负矩阵。
4.(解码策略)令 𝑇 是 𝐴 的一个编码树,即层谱抽象策略。
5.(解码信息)度量解码策略 𝑇 从信息系统 𝐴 的解码信息
𝒟𝑇(𝐴)。
6.(大数据知识发现与规律揭示原理)如果 𝒟𝑇(𝐴) 适当大,那么存在解码器 𝐷 满足:
𝐷(𝐴; 𝑇) = ⟨𝐾, 𝐿⟩,
即 𝐷 从 𝐴 和 𝑇 直接把 ℬ 的知识 𝐾 和规律 𝐿 解码出来。
这就建立了大数据分析的数学原理,它是学习模型的一个特例。这一原理揭示了,大数据分析本身是一个学习问题,它有科学原
理。因此,数据分析可以建立一个数学理论,它就是大数据分析模型的数学理论。