2015年12月7日星期一

PCA(主成份分析)

简单回顾一下,给自己做个备忘 

目的在于将具有多维属性的数据集进行降维。将n个属性维度映射到k维上(n>k)。在降噪(信号传输),数据挖掘等领域都有应用。 

简单来说,就是给定一个训练集,有n个样本,和a个属性,构成一个n×a的矩阵M。将此训练集中的全部数值都减去期望值(平均值)得到矩阵R。求出M的协方差矩阵k个最大特征值所对应的特征向量矩阵A(k是任选的,对应你结果想要的维数)。再用R×A,得到最终的降维矩阵。 这样得到的矩阵可以保证在每一维度上方差最大。证明要用数学公式,编辑太麻烦,故略。

详见http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html




没有评论:

发表评论