傾向スコア
|Propensity Score
傾向スコア
Propensity Score
観察データを用いた因果推論を行う際に使用される重要な手法で、介入や処置を受ける群(処置群)と受けない群(対照群)の間で、共変量によるバイアスを調整するために用いられます。
An important method used for causal inference with observational data. It is used to adjust for bias due to covariates between the treatment group (those who receive an intervention) and the control group (those who do not).
交絡を調整するバランシングスコア
無作為割付 random assignment を伴わない実験研究や観察研究において、アウトカムに対する要因に交絡 confounding を調整するためのウェイティング・スコア。医療分野やインターネット調査でよく利用されています。複数の共変量 covariate を用いて割付変数(処置変数)2群に割りつけられる予測確率を傾向スコア(Propensity Score, PS)と呼びます。
傾向スコアは、ロジスティック回帰分析で計算することができ、傾向スコアが同じ(近い)被験者をマッチングして対応があるデータとして解析する、傾向スコアを区分変数として層別化する、多変量解析の共変量として解析するなどの方法が取られます。 従来の交絡調整方法と比較して、共変量を1次元に縮約することができるため、マッチングや層別を行いやすく、共分散分析の共変量としても用いやすく解釈もしやすくなります。
ただし、傾向スコアによる調整を適切に行うためには、観測されていない共変量がない(隠れた共変量がない)ことが条件となり、間接的に、傾向スコアを推定するロジスティック回帰のモデルフィットや、傾向スコアによる調整後の共変量の分布の差異が消失していることを確認する必要があります。 データを取得してから事後的に交絡を調整できる手法として、特に医療分野を中心に普及が進んでいます。
ソフトウェア
SPSSではRegressionオプションで傾向スコアの推定が可能です。RではMatchItやtwangパッケージを使って傾向スコアマッチングや加重法を実行するのが一般的です。ロジスティック回帰を使って傾向スコアを推定する場合は、glm()関数にfamily = binomial使用します。Pythonではscikit-learnやstatsmodelsを使ってロジスティック回帰を行い、傾向スコアを推定できます。また、causalmlライブラリを使って、マッチングやIPWを簡単に実行できます。
参考文献
- Rosenbaum, P. R., & Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects. Biometrika, 70(1), 41-55.
- Austin, P. C. (2011). An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies. Multivariate Behavioral Research, 46(3), 399-424.
- Shenyang Y. Guo(著),Mark W. Fraser(著)『Propensity Score Analysis: Statistical Methods and Applications』SAGE Publications, Inc(2009)
- 星野崇宏(2012),『調査観察データの統計科学 因果推論・選択バイアス・データ融合』岩波書店
- 新谷歩(2015),『今日から使える医療統計』医学書院
