分析支援サービス
IBM SPSSを利用したデータ分析、情報活用支援

プライバシーマーク

C&R Tree (Classification and Regression Tree)

公開日:  最終更新日:2015/09/16   Analytics method 

目的変数に対して多数の要因でデータセットをセグメントに分岐し、ツリー図を構築する分析手法。変数の選択や分岐の基準に、不純度を用いる。CHAIDと並びよく利用されるディシジョンツリーの手法だが、分岐は常に2つになる。
目的変数には、カテゴリ変数(比率)とスケール変数(平均値)の両方が利用できる。カテゴリ変数の場合の不純度はGini係数を利用することができ、スケール変数の場合の不純度は分散になる。
常に2分岐になるためツリーは深くなりやすく、ツリーの成長停止規則を定義しないと、不純度が0になるまで分岐されオーバーフィットが起こるため、剪定(枝刈り)が必要である。目的変数をスケール変数で分割する際のカットオフ値の探索にも応用される。


■ 関連する分析手法
CHAID

■ 関連するTIPS
IBM SPSS Statisticsによる生存曲線プロットの軸余白の編集方法

■ IBM SPSS製品
IBM SPSS Statistics (Advanced Statistics オプション)

■ 支援サービス
IBM SPSS Statistics 医療従事者のための分析3 (操作研修コース)

PAGE TOP ↑