主成分分析についてわかりやすく解説しております。
統計科学研究所
はじめよう多変量解析~主成分分析編~
主成分分析とは?
多次元データを情報を出来るだけ損なわずに低次元空間に情報を縮約する手法
情報量の最大化と分散の最大化は等価
分散共分散行列の固有値は分散に相当する。
失われる情報量の評価方法として以下が挙げられる。
1.第i主成分の寄与率 = 第i主成分の固有値/固有値の総和
全情報のうち該当する第i主成分の占める情報量の割合
2.第i主成分の累積寄与率 = 第1主成分から第i主成分までの固有値の和/固有値の総和
全情報のうち該当する第i主成分までの占める情報量の割合