分析支援サービス
IBM SPSSを利用したデータ分析、情報活用支援

プライバシーマーク

主成分分析(Principal component analysis)

公開日:  最終更新日:2020/06/17   Analytics method 

主成分分析 Principal component analysis は、相関の強い観測変数を統合して、新たな合成変数を作成する分類のための分析手法です。多数の量的変数を少数の量的変数に縮約する目的で利用されます。例えば、複数ある満足度の項目や評価項目をまとめたい場合などです。

ある飲食店で実施した6項目の満足度調査の例で考えてみます。

主成分分析

主成分分析を実行すると、各観測変数に重み(係数)が付けられ、主成分と呼ばれる合成変数が作成されます。このとき、元のデータの持つ情報の損失がなるべく小さくなるように主成分を作成していきます。最初に作られる主成分を第1主成分、次に作られる主成分を第2主成分・・・と呼び、各主成分の構造を確認して分析者が名称をつけていきます。

第1主成分はすべての観測変数の係数がプラス(+)であるため、すべての項目の満足度が高い人ほど第1主成分の得点が高くなります。つまり、第1主成分は「総合満足度」を表していると解釈することができます。

第2主成分は料理に関する係数がマイナス(-)で、店舗やスタッフに関する係数がプラス(+)です。よって、第2主成分は、料理満足が高いか店舗満足度が高いかの「満足度の傾向」を表していると解釈することができます。

なお、このような主成分の解釈やネーミングは、分析者の仮説や知見、解釈の仕方やセンスなどによって大きく変わるため、上記の解釈はあくまでも一例です。

観測変数がたくさんあって解釈がしにくい場合、観測変数を少数の合成変数(主成分)に縮約することができれば、散布図などによる2次元の視覚化も可能となり、解釈がしやすくなります。この例では、6つの観測変数を2つの主成分に縮約しましたが、実際に主成分分析を行う場合は、各主成分の固有値や寄与率、累積寄与率などを確認しながら、できるだけ多くの情報を説明できるように主成分の数を検討します。

また、各主成分同士は無相関になる特徴があるため、相関の強い変数が多数ある場合に、最初に主成分分析を行い、その合成変数(主成分)を例えば回帰分析の独立変数に使用するという使い方もされています。主成分分析そのものは、従属変数を使用しない分類のための分析手法ですので、特に機械学習(マシンラーニング)の領域では、教師なし学習の手法に分類されます。

主成分分析は、観測変数同士の相関に基づいて変数を統合するため、量的変数(スケール変数)を使用しますが、量的変数とみなせる5件法や7件法などの順序尺度の変数もよく使用されています。

主成分分析は、IBM SPSS Statistcs BaseIBM SPSS Modelerで実行可能ですが、いずれも因子分析の計算方法の1つとしてインターフェイスが用意されています。

■ 関連するデータ分析手法
因子分析
回帰分析

■ IBM SPSS製品
IBM SPSS Statistics Base
IBM SPSS Modeler

PAGE TOP ↑