IBM SPSS Statistics 25
収集したアンケートや臨床・社会調査などの統計データを分析する

プライバシーマーク

option-Decision Trees

Decision Trees

従属変数を分類する予測モデル、決定木分析

Product Information

IBM SPSS Decision Treesは、IBM SPSS Statistics Baseに追加されるオプション製品です。Decision Tree のプロシージャーは、ツリー・ベースの分類モデルを作成します。ケースをグループに分類したり、独立変数の値に基づいて従属変数の値を予測します。このプロシージャーには、探索的および確証的な分類分析のための検証ツールが用意されています。購買データや契約データ、臨床データなどでも特にサンプルサイズが大きいデータセットの分析で活用されているオプションの1つです。

  • Decision Treesのライセンス認証が行われると、分類サブメニュー内にツリーメニューが追加され、決定木分析(ディシジョンツリー)の機能が使用できるようになります。

■ Decision Trees オプションの主要な機能

■ ディシジョンツリー(決定木)図の作成
Decision Trees オプションでは、多数の独立変数に基づいて従属変数を分類するディシジョンツリーが作成されます。視覚的なイメージで、従属変数を説明する条件が示され、どのようなルールによって購買や疾病に至りやすいかを分析することができます。独立変数の選択や値のグループ化などの分割の基準として、CHAID、Exhaustive CHAID、CRT、QUESTの4つのアルゴリズムが搭載されています。

■ ツリー・エディター Tree Editor
ツリー図は、拡大・縮小、ツリー図の方向、フォントや色の変更などのグラフィカルな編集に対応します。大規模データや多数の独立変数を用いることによって、ツリー図が非常に大きくなり一画面に収まらない可能性がある場合、ツリーマップウィンドウを使用することで、ツリー図の全体像を確認しながら解釈の作業を進めることが可能です。

■ CHAID基準 CHAID Criteria
CHAID(Chi-squared Automatic Interaction Detection)は、最適な分割を識別するために、カイ2乗統計を使用してデシジョン・ツリーを構築する分類方法で、多分岐の分類ツリーを構成します。CHAIDは、最初に個々の入力フィールドと結果の間のクロス集計を検査し、カイ2乗独立性検定を使用して有意確率を検定します。有意な独立変数に基づいて従属変数をツリーに分割し、分類ルールと予測ルールを構成します。

■ CRT基準 CRT Criteria
CRT(Classification and Regression Tree)は、ノード内の等質性を最大化しようとするディシジョンツリーの手法の1つで2分岐の分類ツリーを構成します。ノードがケースの等質なサブセットでない度合いは不純度に基づきます。例えば、すべてのケースで従属変数が同じ値を持つターミナル・ノードは、純粋なので等質なノードでありそれ以上の分割は不要です。不純度の測定に使用される手法、およびノードの分割に必要な最小限の不純度の減少量を選択できます。

■ QUEST 基準 QUEST Criteria
QUEST(Quick Unbiased Efficient Statistical Tree)は、仮説検定を用いたディシジョンツリーの手法の1つで、2分岐の分類ツリーを構成します。ノードを分割する際の有意レベルを指定できます。有意レベルが指定された値以下でない限り、独立変数を使用してノードを分割することはできません。値を小さくすると、最終的なモデルから除外される独立変数が多くなります。

■ 誤分類コスト Misclassification Costs
カテゴリー(名義、順序)の従属変数では、誤分類コストにより、分類の誤りに関連する相対ペナルティーについての情報を含めることができます。例えば、心臓疾患のリスクが高い人を低リスクと誤分類するコストは、低リスクの人を高リスクと誤分類するコストよりもずっと高いはずです。誤分類コストを設定することによって、高リスクのケースが低リスクと予測される可能性を下げることができ、高リスクに該当するケースの予測精度を改善します。

■ 選択規則とスコアリング規則 Selection and Scoring Rules
選択規則や分類/予測規則をIBM SPSS Statistics のコマンド・シンタックス、SQL、プレーンテキストの形式で生成できます。これらの規則は、ビューアーで表示したり外部ファイルに保存することができ、新しいケースの予測やスコアリングに活用するために用いられます。

SPSS Statitics ソフトウェア価格
SPSS Statitics 動作環境

PAGE TOP ↑