スタッツギルド

重み付きカッパ係数の出力

順序尺度に適用する一致度の指標

カッパ係数 kappa coefficient は、同じ対象に対して2つの評価間の一致度を調べる統計量の1つです。これは「偶然による一致を除外した上での一致の割合」を示し、主にカテゴリカルなデータに用いられます。評価者間の一致度や繰り返し測定の一致度を見るときに用いられ、評価方法の信頼性を調べることができます。-1≦κ≦1となり、値が1に近いほど一致度が高く、0に近い場合は、一致が偶然によるものと見なされます。 カッパ係数には、名義尺度の変数に適用するものと、カテゴリ間に順序の意味を持つ順序尺度に適用する重み付きカッパ係数があります。例えば、2人の医師の診断として名義尺度(疾患A、疾患B、疾患C)の一致度を調べる場合にカッパ係数が適用できますが、順序尺度(軽症、中等症、重症)の診断の一致度を調べる場合には、重み付けカッパ係数を用いる方がより適切です。重み付けカッパ係数には、1次の重み付け、2次の重み付けがあり、不一致率をより強く表す場合に用いられます。
公開日: 2017-06-13更新日: 2025-09-01

重み付きカッパ係数の求め方

分析 > 尺度 > 重み付きカッパ

IBM SPSS Statistics では、Baseの基本機能として「重み付きカッパ」を実行可能です。この例では、2人の評価者A、Bが20人の被験者に4件法で評価した結果の一致度を、1次の重み付けカッパ係数を利用して確認してみます。

kappa coefficient

重み付きカッパの出力

  1. 1.「分析」メニュー >「尺度」>「重み付きカッパ」を選択します
  2. 2.「ペアごとの評価者」に2つの変数を移動します(評価者A、評価者Bなど)
  3. 3.「OK」ボタンをクリックします
kappa coefficient

出力には、重み付カッパ、標準誤差、有意確率、95%信頼区間などが出力されます。

kappa coefficient

カッパ係数の一般的な目安としては、下記の表を参照してください。この例では、重み付きカッパ係数が、0.425という結果となりました。つまり、評価者AとBの評価は中程度の一致と解釈されます。

kappa coefficient

重み付カッパでは、基準ボタンを使用して線型の重み2次の重みを選ぶことができます。これは、不一致の程度に応じて重みを加える方法です。線形重み付けは不一致の程度に比例して重みを加え、二次重み付けは不一致の度合いが大きくなるにつれて重みをより強く加えます。

kappa coefficient

デフォルトでは、線形の重みが選択されています。

v26以前での重み付きカッパ係数

拡張機能によるメニュー追加

v26以前のバージョンでは、重み付きカッパを求めるメニューは表示されていません。別途、拡張ハブメニューを使用して「STATS_WEIGHTED_KAPPA」モジュールを追加することで使用できるようになります。拡張機能の追加には原則としてインターネットへの接続環境が必要です。

拡張機能による「STATS_WEIGHTED_KAPPA」の追加

  1. 1.「拡張機能」メニュー > 「拡張ハブ」を選択します
  2. 2.「STATS_WEIGHTED_KAPPA」の「拡張の取得」にチェックを入れます
  3. 3.「使用条件の条項に同意」を選択します
  4. 4.「完了」ボタンをクリックします
  5. 5.「OK」ボタンをクリックします
kappa coefficient kappa coefficient

拡張機能が追加されると、尺度メニューに「重み付きカッパ」が追加されます。これにより、v26以前のバージョンでも重み付きカッパ係数を求めることができます。

kappa coefficient

まとめ

名義尺度データでは、カテゴリ間に順序関係が存在しないため、不一致の「程度」を区別することが本質的に意味をなしません。したがって、名義尺度データの一致度を測定するためには、通常のカッパ係数(重み付けなしのカッパ係数)が一般的に使用されます。通常のカッパ係数では、全ての不一致が等しく扱われ、特定のカテゴリ間の不一致に重みを加えることはありません。重み付きカッパ係数は、順序尺度データの評価者間一致度を測定する際の重要な統計手法です。通常のカッパ係数が名義尺度データの単純な一致を評価するのに対し、重み付きカッパはカテゴリ間の不一致の程度を考慮に入れます。この手法は特に、医療分野の診断評価や教育評価の研究で有用です。目的や使い方、用途に応じて、IBM SPSS製品を有効にご活用いただき、課題解決・価値創造にお役立てください。

参考文献

[1]Cohen, J.,(1960). A coefficient of agreement for nominal scales. Educational 159 12 160 and Psychological Measurement 20, pp.37-46.
[2]芝祐順,他(2002). 統計用語辞典,新曜社
[3]Landis, J.R.; Koch, G.G.(1977). “The measurement of observer agreement for categorical data”. Biometrics. 33 (1): pp.159-174.
[4]対馬 栄輝(2002).理学療法の研究における信頼係数の適用について.理学療法科学,17(3),pp.181-187.
[5]IBM SPSS Statistics Base