分析支援サービス
IBM SPSSを利用したデータ分析、情報活用支援

プライバシーマーク

ケース識別変数(ID)の追加 / Statistics

公開日:  最終更新日:2018/08/30   SPSS TIPS Statistics 

IBM SPSS Statisticsでは、データセットの各ケースにIDを付与するための関数が用意されています。IDとは、従業員番号や顧客番号などのように個々のケースを識別するためのコードです。IDを付けることで、データソースのどのデータとStatisticsデータが対応しているかを確認することができるほか、ファイル結合や再構成などのデータ加工にも必要になるため、データファイルを作成する際は各ケースにIDを付けることをお奨めします。

例として、下記のデータセットにはID変数がありません。このようなケースIDを特定する変数を持たないデータセットで、仮に年齢を若い順に並び替えた(Ageで昇順にソートした)場合、元々1行目にあったケースが何行目に移動したか分からなくなってしまいます。

SnapCrab_No-0000

このとき、ケースを特定できるIDがあれば、並び替えを行った後のデータセットでもケースを識別することができ、IDで並び替えを行うことで元の並び順に戻すことも簡単です。この例では、データセットの1行目から整数値を振ったID変数を追加してみます。新しい変数を作成する場合は、変換メニューに含まれる「変数の計算」を利用します。各ケースにIDを付与する場合は、$CASENUM システム関数が便利です。

■ Statisticsでケース識別変数(ID)を追加する方法
(1)「変換」メニューから「変数の計算」を選択します。
(2)「目標変数」ボックスに「ID」と入力します。
(3)「数式」ボックスに「$CASENUM」と入力します。

SnapCrab_No-0001

(4)「OK」ボタンをクリックして「変数の計算」ダイアログボックスを閉じます。

SnapCrab_No-0002

データファイルの右端に新規変数としてIDが追加され、1行目から順番に整数が振られていることが分かります。この変数をID(識別)変数として利用することができます。新規作成された変数はデフォルトで測定の尺度がスケールに設定され、少数桁数は2桁までの表示となりますので、必要に応じて変数ビューで変数の定義を変更してください。なお、変数の並び順は列見出しをドラッグすることで簡単に移動可能です。

このようにケース番号を識別するID変数を追加することで、並び替えを行ったデータセットでのケースの特定を行うことができるほか、複数のファイルを結合する際のキーとして用いたり、データの再構成(縦持ちデータを横持ちデータに変換する、ロングデータをワイドデータに変換する)を行ったり、傾向スコアによるマッチングを行う際の識別変数として使用したりすることができるようになります。

目的や使い方、用途に応じて、IBM SPSS Statisticsを有効にご活用ください。

(この記事のスクリーンショットは、IBM SPSS Statistics Base 25を使用しています)

■ 参考文献
[1] IBM_SPSS_Statistics_Core_System_User_Guide.pdf
[2] IBM_SPSS_Statistics_Base.pdf

■ IBM SPSS Statistics Base
IBM SPSS Statisticsによるデータ入力、読込み、データ加工、基本統計量の出力、推測統計(仮説検定・信頼区間)、回帰分析、因子分析、クラスター分析、分散分析、グラフ作成、外部ファイルへのエクスポート、拡張機能などを有する基本モジュール
http://www.stats-guild.com/ibm-spss

■ E-Learningコース
SPSSによる統計解析を学習するための ハンズオン形式のE-Learningコース(Textbook付属)
http://www.stats-guild.com/spss-e-learning-textbook

■ SPSS講習会 SPSS Learning Room(E-Learning+講習会+QA)
E-Learningと集合タイプ講義をブレンドしたスタイルの講習会
https://www.stats-guild.com/spss-learning-room

SPSS講習会

PAGE TOP ↑