多変量データに対する主成分分析
右の表は種々の色サンプルの分光反射率のデータです。
第1行目は400nmから700nmまでの40nmごとの波長の値
です。第1列目は色サンプルの番号です。
それらサンプルの分光反射率の値を1000倍した値が
データとして記入されています。
このデータに対して主成分分析を行ってみましょう。
Step 1 データ配列の準備
表の名前はDataとしています。
データ格納用の2次元配列を準備します。
表データを配列に格納します。
備考
表の名前のDataについては、第1添字は列、第2添字は行を参照することに注意。
Dataの第1行目と第1列目は項目名になっているので、それぞれ添字変数に1を加えて、
それらをスキップしています。
Step 2: 分散共分散行列の作成
データ配列Aから標本分散共分散行列を計算します。
Step 3 固有値と固有ベクトルの計算
標本分散共分散行列の固有値計算を行います。
eに固有値、Vに固有ベクトルの計算値が格納されます。
寄与率の計算
累積寄与率の計算
右の表は主成分の値(e)と寄与率(f)と累積寄与率(g)を示して
います。第1成分で66.9%、第2成分まで含めると89.6%、 第3成分
までを含めると98.7%まで変動を説明することが判ります。
それゆえ、主成分は最初の3成分のみを考慮することにします。
固有ベクトル
このデータでは、ベクトルの要素番号は波長に対応していました。
そこで、各番号に対応する波長を設定します。
下の表は各波長に対する3つの固有ベクトルの値を示しています。グラフはそれらの図示です。
pfrm0001.png
第1固有ベクトル
第2固有ベクトル
第3固有ベクトル
この表データのグラフ化はデータグラフ機能を用いて行います。
まず、表でデータ部分を選択し、メニューの「実行」-「2D-グラフ」-「データ型[X-Y軸]」を選択
します。そして、描画されたグラフについて、グラフ設定で調整を行います。
主成分分析によって、サンプルの分光反射率は上記3つの固有ベクトルの線形和で良好に
表されることが判ります。
スコアの計算
各サンプルの3つの主成分ベクトルに対する
スコアを計算します。
右の表は各サンプルのスコアを示しています。