スタッツギルド

Modelerの基本的な使い方

ノードと呼ばれるアイコンを組合せてキャンバスに処理フローを描きます。ストリームとして視覚的に管理でき、ノーコードで高度な分析機能にアクセスできます。

IBM SPSS Modeler 製品情報
SPSS Modelerのストリームイメージ
初級編AChapter1

CRISP-DMで分析計画

ビジネス課題と分析目標の理解

CRISP-DM (CRoss-Industry Standard Process for Data Mining) は、IBM SPSS Modelerが採用しているプロセスモデルです。6つのフェーズで構成され、CRISP-DMに基づいてデータ分析を行うことで、効率よくデータ分析を進めることができます。ビジネスや分析の課題は頭の中で考えるだけでなく、きちんと文書化することが大切です。

初級編AChapter2

Modelerに
データを読み込もう

データベースやCSVなど多様なデータソースに対応

データインポートは、入力パレットを使用します。可変長ファイルExcelデータベースStatisticsファイルなどが代表的です。カンマ区切りのCSVの場合、区切り文字、ストレージ、データ型などの主要な項目の指定を行うだけです。インポートするデータは1列1変数、1行1レコードの形式になっている必要があります。

可変長ファイル
可変長ファイル
Excel
Excel
データベース
データベース
Statistics
Statistics
ユーザー入力
ユーザー入力
データ型
データ型
初級編BChapter1

データの加工と前処理

アイコンを組合せて複雑な処理も自由に

データの加工や前処理には、レコード設定フィールド設定を使います。ファイル結合やフィールド作成(年齢→年代、都道府県を地域別にまとめる、利用金額を10分位に分割、前回利用との差分を出す、etc)などを、用途に応じたノードの組合せで実現します。加工フローはアイコンをつなげた視覚的なイメージで管理できます。

条件抽出
条件抽出
レコード結合
レコード結合
データ分類
データ分類
フラグ設定
フラグ設定
再構成
再構成
フィールド作成
フィールド作成
初級編AChapter4

基礎分析へ

データ検査で全フィールドを一度の要約

高度な分析処理に進む前に、データの特徴を調べる基礎分析を行います。各フィールドの要約(平均値、標準偏差、最小値、最大値、%など)、グラフ作成、欠損レコードの比率や内訳、外れ値や極値の確認、グループ比較などは、出力とグラフの機能で対応します。データ検査で全フィールドの特徴を一気に調べて、スクリーニングすることもできます。

クロス集計
クロス集計
グラフボード
グラフボード
Webグラフ
Webグラフ
記述統計
記述統計
変換
変換
データ検査
データ検査
初級編BChapter1

特徴量やレコードの
スクリーニング

特徴量選択や異常値検査

特徴量選択ノードを使用することで、対象と相関/連関の高いものだけを選別して予測モデル作成に流し込むフィルタリングにも対応しています。また、異常値検査ではクラスタリングにより異常レコードを識別してストリームから除外させることができ、予測モデル作成のフィールド選択を補助します。

特徴量選択
特徴量選択
異常値検査
異常値検査
初級編CChapter1

予測モデル作成、
類似パターン発見

専門知識がなくてもノーコードで高度な分析

予測モデル作成の50種類近い手法がGUIで提供されます。教師あり学習のニューラルネットワーク線型モデル決定木分析ベイジアンネットワークランダムフォレストなどのほか、教師なし学習として、K-MeansKohonenなどのクラスター分析、因子分析や主成分分析に対応します。共起規則を抽出するアソシエーションやシーケンスモデルも使用可能です。

一般化線型
一般化線型
C&R Tree
C&R Tree
XGBoost
XGBoost
ベイズ
ベイズ
K Means
K Means
Apriori
Apriori
初級編CChapter3

予測精度の高いモデルを
ランキング

オートメーションで
多数モデル生成と比較

複数のモデルを同時実行するオートメーションの機能で、例えば、買う/買わないの2値の分類モデルにおいて、ニューラルネットワーク、決定木分析、ロジスティック回帰分析、SVMなどの手法を指定し、変数選択やブースティングなど複数パラメータを設定して、モデルを複数パターン作成させて、精度の良いモデルのランキングが可能です。

自動分類
自動分類
自動数値
自動数値
自動クラスタリング
自動クラスタリング
時系列
時系列
初級編CChapter6

予測値のスコアリング

外部エクスポートや
システムとの連携

加工や前処理を終えたデータセットや予測値や確率などを、外部ファイルにエクスポートします。データベースのテーブルに書き込んだり、Excel形式で保存することで、別のアプリケーションやツールでの活用を実現します。エクスポートの方法は他のノードと同じく、ストリームの最後にリンクして出力先の指定を行うだけです。

データベース
データベース
フラットファイル
フラットファイル
Excel
Excel
Statistics
Statistics
JSONエクスポート
JSONエクスポート

無料紹介動画で
イメージを掴もう

始めてみよう! SPSS Modeler

SPSS Modeler 紹介動画
無料紹介動画を見る