分析支援サービス
IBM SPSSによるデータ分析、情報活用

欠損ケースを除外したデータセットの作成 / Statistics

IBM SPSS Statisticsでは、重回帰分析やロジスティック回帰、因子分析などの多変量解析を実行する場合、使用する変数に1つでも欠損値を持つケースは自動的に分析から除外されます。分析時に欠損値を除外する操作を行わなくても自動的に有効値を持つケースだけが利用されますが、最終的に分析に使用するケース数を揃えるために、あらかじめ欠損値を持つケースを除外したデータセットを用意したい場合もあります。

例えば、以下のSPSSデータセットの変数Q1からQ5には、欠損値が含まれています。

分析や集計に利用するケースを絞り込む機能は、データメニューに含まれる「ケースの選択」を利用します。この例では、IF条件を利用して変数Q1~Q5について欠損値を含まないケースのみを選択し、選択されたケースを新しいデータセットにコピーする方法を確認してみます。


(1)「データ」メニューから「ケースの選択」を選択します。
ケースの選択

「ケースの選択」ダイアログが表示されます。この画面でケース選択のための条件と、出力方法の2つの設定を行います。はじめに欠損値を持たないケースのみを選択する条件設定を行います。

(2)「IF条件が満たされるケース」ラジオボタンをクリックします。 (3)「IF」ボタンをクリックします。
IF条件

「ケースの選択: IF条件の定義」ダイアログが表示されますので、ケース選択のための条件式を入力します。この例では、変数Q1からQ5について欠損値を持たないケースを選択します。このとき使用するには、欠損値関数のNMISS()です。この関数は、カッコ内に指定されたは変数の欠損値をカウントします。

NMISS(var1,var2,var3) ケース(行)ごとに変数var1、変数var2、変数var3の欠損値をカウントします

有効ケースには欠損値が含まれませんので、変数Q1から変数Q5について欠損値を持たないケースの計算結果は0になります。したがって、具体的に指定する条件式は、「NMISS(Q1,Q2,Q3,Q4,Q5)=0」になります。

(4)「関数グループ」の「欠損値」をクリックし、下部に表示される「NMISS」を選択します。
(5)「NMISS(Q1,Q2,Q3,Q4,Q5)=0」と入力します。 ※変数名は、ダイアログ左側の変数の一覧からダブルクリックで指定できます ※変数名の区切りは半角のカンマです ※カッコの指定ほか全て半角で指定します
ケースの選択
(6)「続行」ボタンをクリックします。

続いて、出力方法を指定します。この例では、条件を満たしたケースを新しいデータセット「data」にコピーします。

(7)「選択されたケースを新しいデータセットにコピー」ラジオボタンを選択します。 (8)「データセット名」に「data」(任意の名前)を入力します。
(9)「OK」ボタンをクリックします。

以上で、dataという名前の新規データセットが作成されています。タスクバーに表示されているIBM SPSS Statisticsをクリックしてデータセットを切り替えます。(「ウィンドウ」メニューからも選択できます)

上記のように、欠損値を持たない(変数Q1~変数Q5で欠損値の数が0)ケースのみが選択され、欠損値を持つケースが除外されたデータセットを作成することができました。欠損値が含まれるケースをケースごと除外する方法は、リストワイズと呼ばれます。この時点では、ファイルは保存されていませんので、以後の分析や集計で活用する場合は、ファイルに名前を付けて保存しておくと良いでしょう。

なお、このようなリストワイズによる欠損値の除去はよく使用される方法ではありますが、バイアスを生じる可能性がありますので、欠損値処理のより適切な方法として多重代入法による欠損値代入があります。

目的や使い方、用途に応じて、IBM SPSS製品を有効にご活用いただき、課題解決・価値創造にお役立てください。

IBM SPSS Statistics Base

IBM SPSS Statisticsによるデータ入力、読込み、データ加工、基本統計量の出力、推測統計(仮説検定・信頼区間)、回帰分析、因子分析、クラスター分析、分散分析、グラフ作成、外部ファイルへのエクスポート、拡張機能などを有する基本モジュール
https://www.stats-guild.com/ibm-spss

E-Learningコース

https://www.stats-guild.com/spss-e-learning-textbook
PAGE TOP ↑