IBM SPSS Modeler 18
予測分析でビジネスを成功に導く価値を発見・創造する

プライバシーマーク

Modelerの使い方

SPSS Modelerの基本的な使い方

データインポートから予測モデル作成のアイコン

IBM SPSS Modelerは、キャンバスと呼ばれる領域に、機能別にまとめられたノードと呼ばれるアイコンを組み合わせることで、データインポートから加工と前処理、分析、予測モデル作成、スコアリングを行います。処理フローがアイコンでつなげられた「ストリーム」として視覚的に管理できるため、分析設計から確認までがしやすく、プログラミングに慣れていないユーザーでも高度な分析機能にアクセスすることができます。

SPSS Modeler

データのインポート

入力ノードの指定

SPSS Modelerに分析データをインポートするためには、入力パレットを使用します。代表的なノードは「可変長ファイル」「Excel」「データベース」「Statisticsファイル」です。カンマ区切りのCSVファイルをインポートするためには、可変長ファイルを用います。ファイル名、区切り文字、ストレージ、データ型などの主要な項目の指定を行うだけで簡単にインポートができます。データベースのインポートを行う場合は、ODBC接続の設定を行います。原則として、インポートするデータは1列1変数、1行1レコードのローデータの形式になっている必要があります。

spss modeler

データの加工と前処理

レコード設定、フィールド設定ノードの指定

インポートしたデータの加工や前処理を行うためには、レコード設定やフィールド設定パレットを使用します。異なるデータソースの結合やフィールド作成(年齢→年代にする、都道府県を地域別にまとめる、利用金額を10分位に分割する、前回利用との差分を出す、etc)などを、用途に応じたノードの組み合わせで実現します。データ加工のフローは、視覚的に確認しやすいアイコンをつなげたイメージで管理できます。条件抽出やサンプリング、RFMフィールド作成、時系列の変換など多様な加工に対応しています。

spss modeler

基礎分析

出力、グラフ作成ノードの指定

予測モデル作成や統計分析など高度な処理に進む前に、データの特徴を調べるための基礎分析を行います。各フィールドの要約(平均値、標準偏差、最小値、最大値、%など)、グラフ作成、欠損レコードの比率や内訳、外れ値や極値の確認、グループ別の比較などは、出力とグラフの機能で対応します。データ検査を行うと、各フィールドの特徴を一気に調べるのに便利なほか、欠損レコードが多いフィールドを自動的に除外させるなどのスクリーニングのためのノード追加も容易です。

spss modeler

スクリーニング

特徴量選択や異常値検査ノードの指定

予測モデル作成の手法の中には入力フィールド(特徴量)を選別する(決定木分析やランダムフォレスト、線型モデルのステップワイズ、Lassoなど)ものもありますが、特徴量選択ノードを使用することで、対象フィールドとの相関/連関の高いものだけを選別して予測モデル作成に流し込むフィルタリングにも対応しています。また、異常値検査ではクラスタリングの機能を利用して、異常レコードを識別してストリームから除外させることができ、予測モデル作成のフィールド選択を補助します。

spss modeler

予測モデル作成

モデル作成ノードの指定

Modelerでは、予測モデル作成の機能を豊富に備えていて50種類近い手法がGUIで提供されます。予測のための教師あり学習として、ニューラルネットワーク、線型モデル、決定木分析、サポートベクターマシン、ベイジアンネットワーク、ランダムフォレストなどが使用可能なほか、教師なし学習として、K-MeansやKohonenなどのクラスター分析、因子分析や主成分分析に対応します。共起規則を抽出するアソシエーションやシーケンスモデルも使用可能です。

spss modeler

モデルの自動生成

オートメーションノードの指定

Modelerでは、モデル作成のための手法をさまざまなパラメーター設定で複数実行するオートメーションの機能を備えています。例えば、買う/買わないの2値の分類モデルを作成する場合、ニューラルネットワーク、決定木分析、ロジスティック回帰分析、サポートベクターマシンなどの手法を指定し、変数選択の方法や、ブースティングやバギングの使用など複数パラメータを設定して、モデルを複数パターン作成させて、精度の高いものやモデルがシンプルなものなどをランキングすることが可能です。

spss modeler

スコアリング

エクスポートノードの指定

Modelerで加工や前処理を終えたデータセットや予測モデルに基づく予測値や確率などを、外部ファイルにエクスポートします。指定したデータベースのテーブルに書き込んだり、Excel形式のファイルに保存することで、別のアプリケーションやツールでの活用を実現します。エクスポートノードの使用方法は他のノードと同じく、ストリームの最後にリンクして出力先の指定を行うだけです。

mdl-exp

Modeler テキストブック

IBM SPSS Modelerによるデータインポート、前処理、データ分析、予測モデル作成のための手順と解釈、注意点などをStep By Stepで解説した研修用テキストブックです。Modeler 導入時の無償特典です。

■ IBM SPSS Modelerによるデータマイニング【初級編A】データのインポートと基礎分析
■ IBM SPSS Modelerによるデータマイニング【初級編B】データの加工と前処理
■ IBM SPSS Modelerによるデータマイニング【初級編C】予測モデルの作成とスコアリング

spss modeler 書籍

B5版 各180頁 2019/2/1(第5版)
IBM SPSS Modeler 18.2対応
FAXでのお申込み


IBM SPSS Modeler 導入と活用のための支援サービス

無料の導入コンサルテーションから、オンサイト研修、分析サービス、定期アドバイザリーサービスなどをご用意しています。ソフトウェアの導入とあわせてご利用ください。

導入・活用支援サービス


■ お問合せ
SPSS製品のご購入・ご導入についてご不明な点等につきましてはお気軽にご相談ください。
スタッツギルド株式会社 SPSSセールス&マーケティング部
お見積りフォーム : https://www.stats-guild.com/modeler-request
TEL : 047-711-0427(平日 9:00-18:00)


PAGE TOP ↑