< 上一个 | 内容 | 下一个 >

3.1.5 数据降维

大数据处理中的另一个焦点问题是数据的降维算法,用来减少高维数据的运算代价。自经典的 Johnson-Lindenstrauss 引理和压缩感知算法诞生以来,数据降维算法得到了大量的发展。压缩、蒸馏、核心集等算法的进步也推动了业界对高维数据处理技术的发展。很多流处理与数据降维的理论算法依赖于随机高斯变量的独特性质,而后者在实际中很难被实现。

由于上述各类算法的高效性,它们在实际应用中具有极大的吸引力。大数据算法领域成为当前计算机科学中的热门研究方向之一,备受国际知名学术单位(如麻省理工学院、斯坦福大学等)和信息技术产业界知名研究机构(如谷歌、微软等)的重点发展。在当前大数据时代,亚线性算法、动态算法及降维等方法的进展为处理庞大数据量的实际问题提供了有力支持,同时也为计算机科学领域的创新和进步带来了新的可能性。然而,当前大数据的理论算法研究与实际应用之间仍然存在相当大的距离。因此,填补当前理论算法研究与实际应用的空白是大数据处理的关键。