生存時間分析
|Survival Time Analysis
生存時間分析
Survival Time Analysis
特定の事象が発生するまでの時間を解析するための統計手法です。主に医療分野で患者の生存期間を分析するために用いられますが、工学分野で製品の故障時間やマーケティングで顧客離脱までの時間を調べる場合など、幅広い分野で利用されています。
A statistical method used to analyze the time until a specific event occurs. It is commonly used in the medical field to study patient survival times, but is also widely applied in areas such as engineering to examine time to product failure, and in marketing to analyze time to customer churn.
イベントが起きるまでの時間と要因の分析
生存時間分析は、イベントが起きるまでの時間を用いた分析手法です。医療分野において多用され、異なる治療法や薬剤による生存と死亡、術後治療による再発の有無、入院から退院の分析などの適用例があります。工学分野においては、製品の故障の有無、異常の有無などを分析する例があります。 従来の統計手法では扱いにくい「打ち切り(censoring)」という未観測データの存在に対応できる点が特徴です。
例えば、2つの治療法によって、患者の死亡に差が認められるかどうか、影響を与える要因が何か、どの程度の影響があるかなどを分析することができます。 分析に必要なデータは、イベントが起きるまでの時間の長さやイベントの有無を表す変数、独立変数や共変量です。 独立変数を1つだけ用いる場合、カプラン・マイヤー法(Kaplan-Meier)がよく使用されます。この分析手法は、要因にあたる変数を1つしか用いませんので、単変量の解析に該当します。例えば、患者の年齢・性別・体重などのその他の要因(共変量)の影響を考慮に入れることができません。
生存曲線は、横軸に時間、縦軸に生存率を示したグラフで、ある時点における生存率を確認したり、グループによる差を比較できます。この例では、2つの治療法による生存率の違いを視覚化しており、治療法B の方が、生存率が高いことが読み取れます。また、打ち切り例には縦線などの記号がプロットされますが、生存率が更新されず、グラフが水平に推移していることが分かります。
比例ハザードモデル(Cox回帰分析)を用いると、複数の共変量を用いた分析を行うことができ、患者の背景因子を制御した影響の大きさを調べることができます。複数の変数に基づくこの分析手法は、多変量解析に該当します。
生存時間分析の手法は、最近では機械学習とも統合され、より精度の高い予測が可能になっています。たとえば、ランダムフォレストやニューラルネットワークに生存時間データを組み込むことにより、複雑なパターンを学習し、個々の事象発生確率や生存期間を予測することができます。
ソフトウェア
SPSSでは、Advanced Statisticsオプションが生存時間分析に対応しています。分析メニュー内に「生存分析」が追加され、Kaplan-MeierやCox回帰分析を実行可能です。Rでは、survivalパッケージを使用してKaplan-Meier法を実行します。このパッケージは生存曲線の作成や生存時間の推定をサポートしており、詳細な解析も可能です。survminerパッケージのggsurvplotを使えば、美しいグラフも作成できます。Pythonでは、lifelinesやscikit-survivalなどのライブラリを使用してKaplan-Meier法を実行します。これらのライブラリは、生存分析に特化しており、Kaplan-Meier曲線の作成や統計的解析を効率的に行えます。
参考文献
- Kaplan, E. L., & Meier, P. (1958). “Nonparametric Estimation from Incomplete Observations”Journal of the American Statistical Association, 53(282), 457-481.
- Cox, D. R. (1972). “Regression Models and Life-Tables.” Journal of the Royal Statistical Society: Series B (Methodological), 34(2), 187-220.
- Hosmer, D. W., Lemeshow, S., & May, S. (2008). “Applied Survival Analysis: Regression Modeling of Time-to-Event Data”Wiley-Interscience.
- 対馬 栄輝(2018),SPSSで学ぶ医療系多変量データ解析,東京図書
- 中村 剛(2018), 新版 Cox比例ハザードモデル (医学統計学シリーズ 3),朝倉書店
- 杉本 知之(2021),生存時間解析 (統計解析スタンダード) ,朝倉書店
