分析支援サービス
IBM SPSSによるデータ分析、情報活用

ファイルの結合-変数の追加(1)概要 / Statistics

分析に必要なデータがそれぞれ異なるファイルに記録されている場合、分析を実行する前にファイルの結合を行っておく必要があります。ファイルの結合には、ケース(行/レコード)を追加する場合と、変数(列/カラム)を追加する場合の2パターンがあり、ケースの追加は、例えば、100人分のファイルと200人分のファイルを300人分のデータファイルに統合する場合で、変数の追加は、例えば、2つの属性変数(年齢、性別)と3つの詳細変数(商品、金額、個数)を統合して5つの変数を持つデータファイルにする場合に用います。

ここでは、変数の追加の例として、以下の2つのデータファイルを例に挙げてみます。実際のデータでは、より多くの変数が含まれる場合がほとんどですが、例を簡単にするために変数の数とケース数を少なく絞っています。

【1】 顧客情報ファイル 顧客番号をあらわす「ID」と顧客の「性別」(1=男性、2=女性)が記録されています。 顧客1人につき1つのIDになるためIDに重複はありません(ユニークなID)

img-8303-002

【2】 購入金額ファイル 顧客番号をあらわす「ID」と顧客の「購入金額」が記録されています。 1人の顧客が複数回の買い物をする前提となりIDに重複があります。

img-8303-001

仮に、性別ごとの購入金額の合計や平均を計算したい場合、上記の2つのデータに含まれる変数を統合する必要があり、以下のようなデータファイルになっていないといけません。

【3】 顧客情報+購入金額ファイル 変数の追加によるファイル結合を完了したファイルの例。「ID」「性別」「購入金額」が1つのファイルにまとまっています。このように1つのファイルに統合されていれば、性別ごとの購入金額の集計や分析を行うことができます。

img-8303-006

IBM SPSS Statisticsで変数の追加を行う場合に、抑えておかなければならない基本ポイントは以下です。

■ キー変数とキー値 キー変数は変数の追加を行う場合のキーとなる変数で、その中身の値をキー値と呼びます。上記のデータの例では「ID」がキー変数であり、1~3の値がキー値に該当します。2つのファイルに含まれる変数は、キー変数のキー値の一致を条件に統合されますので、ほぼ必須となるデータです。キー変数がない場合は、データの並び順でそのまま結合されることになり、行が抜けていたりずれていると誤ったデータ同士が結合されるため、キー変数による結合が推奨されます。

■ アクティブデータセット SPSSに読み込まれてアクティブになっているデータセットです。複数のデータファイルを開いている場合は、最前面に表示されているファイルがアクティブデータセットになります。変数の追加は、アクティブなデータセットに対して行われます。

■ ルックアップテーブル(または検索テーブル) 2つのデータファイルの変数を統合する際に、キー変数に一意(ユニーク)な値を持つファイルを、ルックアップテーブルまたは検索テーブルと呼びます。IBM SPSS Statisticsのバージョン24までは検索テーブルと呼ばれており、バージョン25からルックアップテーブルと呼ばれています。これは、データベースにおけるマスターテーブルに相当するものです。変数の追加には、1:1の結合と1:Nの結合の大きく2種類があるため、どちらのファイルがルックアップテーブル(または検索テーブル)になっているかを確認しておく必要があります。

■ 除外された変数 変数の追加を行うと、2つのデータファイルの変数が1つのファイルに統合されるため、キー変数を除く他の変数の名前は一意(ユニーク)になっている必要があります。重複する名前の変数は、自動的にファイル結合から除外されることになります。結合の際に、変数の名前を重複しないものに変更すれば、除外されることなく結合後のファイルに含めることができるようになります。

■ ファイルの並び替え 変数の追加を行う場合は、キー変数を昇順に並び替え(ソート)しておかなければなりません。バージョン25からは、変数の追加を行う際に、キー変数の並び替えの有無を選択することができます。

■ 必要なソフトウェア ・IBM SPSS Statistics Base ※変数の追加は、基本的なデータ加工の機能でありオプション製品は必要ありません。

IBM SPSS Statisticsによる変数の追加の具体的な手順は、バージョン25とバージョン24以前で異なります。詳細は以下をご確認ください。

ファイルの結合-変数の追加(2)V25の手順 / Statistics ファイルの結合-変数の追加(3)V24以前の手順 / Statistics

■ IBM SPSS Statistics Base IBM SPSS Statisticsによるデータ入力、読込み、データ加工、基本統計量の出力、推測統計(仮説検定・信頼区間)、回帰分析、因子分析、クラスター分析、分散分析、グラフ作成、外部ファイルへのエクスポート、拡張機能などを有する基本モジュール https://www.stats-guild.com/ibm-spss

■ E-Learningコース SPSSによる統計解析を学習するための ハンズオン形式のE-Learningコース(Textbook付属) https://www.stats-guild.com/spss-e-learning-textbook

■ SPSS講習会 SPSS Learning Room(E-Learning+講習会+QA) E-Learningと集合タイプ講義をブレンドしたスタイルの講習会 https://www.stats-guild.com/spss-learning-room

SPSS講習会
PAGE TOP ↑