分析支援サービス
IBM SPSSを利用したデータ分析、情報活用支援

プライバシーマーク

欠損ケースを除外したデータセットの作成 / Statistics

公開日:  最終更新日:2017/05/30   SPSS TIPS Statistics 

IBM SPSS Statisticsでは、重回帰分析やロジスティック回帰分析、因子分析などの多変量を用いる分析を実行する場合、欠損値を持つケースは自動的に分析から除外されます。したがって、分析時に欠損値を除外する操作を行わなくても自動的に有効値を持つケースだけが利用されますが、分析ごとに自動で欠損値を除外させるのではなく、最終的に分析に使用するケース数を揃えるために、欠損値を持つケースを除外したデータセットを用意したい場合もあります。例えば、以下のSPSSデータセットの変数Q1からQ5には、欠損値が含まれています。

SPSSデータセット

分析や集計に利用するケースを絞り込む機能は、データメニューに含まれる「ケースの選択」を利用します。この例では、IF条件を利用して変数Q1~Q5について欠損値を含まないケースのみを選択し、選択されたケースを新しいデータセットにコピーする方法を確認してみます。


(1)「データ」メニューから「ケースの選択」を選択します。

ケースの選択


「ケースの選択」ダイアログが表示されます。この画面でケース選択のための条件と、出力方法の2つの設定を行います。はじめに欠損値を持たないケースのみを選択する条件設定を行います。

(2)「IF条件が満たされるケース」ラジオボタンをクリックします。
(3)「IF」ボタンをクリックします。

IF条件


「ケースの選択:IF条件の定義」ダイアログが表示されますので、ケース選択のための条件式を入力します。この例では、変数Q1からQ5について欠損値を持たないケースを選択します。このとき使用するには、欠損値関数のNMISS()です。この関数は、カッコ内に指定されたは変数の欠損値をカウントします。

NMISS(var1,var2,var3)
ケース(行)ごとに変数var1、変数var2、変数var3の欠損値をカウントします

有効ケースには欠損値が含まれませんので、変数Q1から変数Q5について欠損値を持たないケースの計算結果は0になります。したがって、具体的に指定する条件式は、「NMISS(Q1,Q2,Q3,Q4,Q5)=0」になります。

(4)「関数グループ」の「欠損値」をクリックし、下部に表示される「NMISS」を選択します。

条件式

(5)「NMISS(Q1,Q2,Q3,Q4,Q5)=0」と入力します。

※変数名は、ダイアログ左側の変数の一覧からダブルクリックで指定できます
※変数名の区切りは半角のカンマです
※カッコの指定ほか全て半角で指定します

ケースの選択

(6)「続行」ボタンをクリックします。

続いて、出力方法を指定します。この例では、条件を満たしたケースを新しいデータセット「data」にコピーします。

(7)「選択されたケースを新しいデータセットにコピー」ラジオボタンを選択します。
(8)「データセット名」に「data」(任意の名前)を入力します。

データセット

(9)「OK」ボタンをクリックします。

以上で、dataという名前の新規データセットが作成されています。タスクバーに表示されているIBM SPSS Statisticsをクリックしてデータセットを切り替えます。(「ウィンドウ」メニューからも選択できます)

結果

上記のように、欠損値を持たない(変数Q1~変数Q5で欠損値の数が0)ケースのみが選択され、欠損値を持つケースが除外されたデータセットを作成することができました。この時点では、ファイルは保存されていませんので、以後の分析や集計で活用する場合は、ファイルに名前を付けて保存しておくと良いでしょう。

目的や使い方、用途に応じて、IBM SPSS製品を有効にご活用いただき、課題解決・価値創造にお役立てください。

■ E-Learningコース:IBM SPSS Statisticsによる統計解析【入門編】【初級編】
SPSSによる統計解析を学習するための ハンズオン形式のE-Learningコース(Textbook付属)
http://www.stats-guild.com/spss-e-learning/courselist

PAGE TOP ↑