分析支援サービス
IBM SPSSによるデータ分析、情報活用

ケース識別変数(ID)の追加 / Statistics

ケースを識別するための変数

IBM SPSS Statisticsには、データセットの各ケースにIDを付与する関数があります。IDとは、従業員番号や顧客番号など個々のケースを識別するコードです。IDによりデータソースとStatisticsのどのデータが対応しているかを確認できるほか、ファイル結合や再構成などのデータ加工にも必要になるため、データファイルには各ケースにIDを付けることが推奨されます。

例として、下記のデータセットにはID変数がありません。このようなケースIDを特定する変数を持たないデータセットで、仮に年齢を若い順に並び替えた(Ageで昇順にソートした)場合、元々1行目にあったケースが何行目に移動したか分からなくなってしまいます。

このとき、ケースを特定できるIDがあれば、並び替えを行った後のデータセットでもケースを識別することができ、IDで並び替えを行うことで元の並び順に戻すことも簡単です。この例では、データセットの1行目から整数値を振ったID変数を追加してみます。新しい変数を作成する場合は、変換メニューに含まれる「変数の計算」を利用します。各ケースにIDを付与する場合は$CASENUM システム関数が便利です。

■ Statisticsでケース識別変数(ID)を追加する方法
(1)「変換」メニューから「変数の計算」を選択します。 (2)「目標変数」ボックスに「ID」と入力します。 (3)「数式」ボックスに「$CASENUM」と入力します。
(4)「OK」ボタンをクリックして「変数の計算」ダイアログボックスを閉じます。

データファイルの右端に新規変数としてIDが追加され、1行目から順番に整数が振られていることが分かります。この変数をID(識別)変数として利用することができます。新規作成された変数はデフォルトで測定の尺度がスケールに設定され、少数桁数は2桁までの表示となりますので、必要に応じて変数ビューで変数の定義を変更してください。なお、変数の並び順は列見出しをドラッグすることで簡単に移動可能です。

このようにケース番号を識別するID変数を追加することで、並び替えを行ったデータセットでのケースの特定を行うことができるほか、複数のファイルを結合する際のキーとして用いたり、データの再構成(縦持ちデータを横持ちデータに変換する、ロングデータをワイドデータに変換する)を行ったり、傾向スコアによるマッチングを行う際の識別変数として使用したりすることができるようになります。

目的や使い方、用途に応じて、IBM SPSS Statisticsを有効にご活用ください。 (この記事のスクリーンショットは、IBM SPSS Statistics Base 27を使用しています)

[1] IBM_SPSS_Statistics_Core_System_User_Guide.pdf [2] IBM_SPSS_Statistics_Base.pdf

■ IBM SPSS Statistics Base IBM SPSS Statisticsによるデータ入力、読込み、データ加工、基本統計量の出力、推測統計(仮説検定・信頼区間)、回帰分析、因子分析、クラスター分析、分散分析、グラフ作成、外部ファイルへのエクスポート、拡張機能などを有する基本モジュール https://www.stats-guild.com/ibm-spss

■ E-Learningコース SPSSによる統計解析を学習するための ハンズオン形式のE-Learningコース(Textbook付属) https://www.stats-guild.com/spss-e-learning-textbook

PAGE TOP ↑