クラスター分析 (cluster analysis)
クラスター分析は、量的変数に基づいて特長やパターンが類似するレコードをセグメントに分類する多変量解析手法です。行動履歴や購買履歴などのデータに基づいて顧客セグメントを作成するマーケティング分野で特によく利用されています。従属変数を指定しない分析手法で、機械学習の領域では教師なし学習とも呼ばれます。クラスター分析の結果に対して個別に分析をかけて予測モデルを構築するなど、比較的分析の初期の段階で利用されることがよくあります。
具体的な手法としては、K-MeansやKohonenなどがあり、K-Meansはクラスター分析の代表的な手法として知られ、後者はニューラルネットワークの一種で機械学習の手法としても知られています。また、IBM SPSS製品では、Two-Stepクラスターアルゴリズムも利用可能です。探索的にクラスタ構築をする場合のほか、すでに構築したクラスタに新規レコードを分類するアプローチも取られます。K-MeansやKohonenはいかにレコードを分類するかの方法ですので、分類したクラスタが意味を持つかどうかは、分析に利用した変数やその他の属性と組み合わせて評価することも重要です。
■ 関連する分析手法
因子分析
主成分分析
■ IBM SPSS製品
IBM SPSS Statistics Base
IBM SPSS Modeler
■ オンライン研修
SPSSデータマイニング基礎講座