K-eansのクラスター数の指定

自動クラスタリングノード

IBM SPSS ModelerのK-Meansノードで一度に指定できるクラスター数は1パターンだけで、デフォルトでは5個です。複数パターンのクラスター数で実行したい場合は、自動クラスタリングノードを用いると効率的です。

ノードの追加

1.ストリームに「自動クラスタリング」ノードを追加します
2.エキスパートタブで「K-means」の「モデルパラメータ」をクリックします
3.「指定…」を選択します

次に、クラスター数の設定を変更します。

パラメータ設定

4.「クラスター数」の「オプション」を選択します
5.「指定」を選択します

クラスター数を指定するエディターが表示されるので、試行したいクラスターの数を指定します。クラスター数として「4」「6」「7」「8」を追加してみます。

複数パターンのクラスター数の指定

6.「クラスター数」に「4」を指定して、追加（→）ボタンをクリックします
7.「クラスター数」に「6」を指定して、追加（→）ボタンをクリックします
8.「クラスター数」に「7」を指定して、追加（→）ボタンをクリックします
9.「クラスター数」に「8」を指定して、追加（→）ボタンをクリックします
10.「OK」ボタンをクリックします

以上の設定で、クラスター数4～8個でそれぞれ分析を実行することになります。

この設定でK-meansによって作成されるモデル数は全部で5個になります。この例では、KohonenとTwo-Stepのモデルタイプはオフにしています。デフォルトでは、結果について良いと判断されるものから上位3個が選択されます（この設定はモデルタブの「保存するモデル数」で変更可能です）。

モデル作成の結果、全体像（レコードが所属するクラスター中心への距離と最近隣クラスター中心との距離の情報に基づいて計算されるシルエット）と呼ばれる指標に基づき、クラスター数5個の場合がレコードをもっとも明確に分類できることが分かりました。試行したクラスター数の中で2番目に良いのは6個の場合、3番目に良いのは8個に分類する場合のようです。

まとめ

クラスター分析は、対象フィールド（従属変数/目的変数）を設定しない教師なし学習の方法です。したがって、分析の結果が正しいかどうかは、データをうまく解釈・説明できる特徴的なクラスターか、施策に落とし込めるクラスターになっているかなどの観点から評価することになりますので、それぞれのプロフィールを評価することが重要です。（クラスタープロフィールは、モデルナゲットをダブルクリックすると表示されます。）以上のように、自動クラスタリングノードを活用することで、K-Meansクラスターの数を数パターン同時に実行することができ、より効率的なモデル作成を実現することができます。目的や使い方、用途に応じて、IBM SPSS製品を有効にご活用いただき、課題解決・価値創造にお役立てください。

K-Meansクラスター数の指定

自動クラスタリングで複数パターンを実行して結果を比較

目次

K-eansのクラスター数の指定

自動クラスタリングノード

ノードの追加

パラメータ設定

複数パターンのクラスター数の指定

まとめ

目次

参考文献