IBM business Partner logo
分析支援サービス
IBM SPSSによるデータ分析、情報活用

Survival Time Analysis

生存時間分析
特定の事象が発生するまでの時間を解析するための統計手法です。主に医療分野で患者の生存期間を分析するために用いられますが、工学分野で製品の故障時間やマーケティングで顧客離脱までの時間を調べる場合など、幅広い分野で利用されています。
  • 分析手法の種類
  • 予測する
  • 要因を探る
  • 比較する
  • 分類する
  • 集計する
  • 可視化する
Application

イベントが起きるまでの時間と要因の分析

生存時間分析は、イベントが起きるまでの時間を用いた分析手法です。医療分野において多用され、異なる治療法や薬剤による生存と死亡、術後治療による再発の有無、入院から退院の分析などの適用例があります。工学分野においては、製品の故障の有無、異常の有無などを分析する例があります。 従来の統計手法では扱いにくい「打ち切り(censoring)」という未観測データの存在に対応できる点が特徴です。

例えば、2つの治療法によって、患者の死亡に差が認められるかどうか、影響を与える要因が何か、どの程度の影響があるかなどを分析することができます。 分析に必要なデータは、イベントが起きるまでの時間の長さやイベントの有無を表す変数、独立変数や共変量です。 独立変数を1つだけ用いる場合、カプラン・マイヤー法(Kaplan-Meier)がよく使用されます。この分析手法は、要因にあたる変数を1つしか用いませんので、単変量の解析に該当します。例えば、患者の年齢・性別・体重などのその他の要因(共変量)の影響を考慮に入れることができません。

生存曲線は、横軸に時間、縦軸に生存率を示したグラフで、ある時点における生存率を確認したり、グループによる差を比較できます。この例では、2つの治療法による生存率の違いを視覚化しており、治療法B の方が、生存率が高いことが読み取れます。また、打ち切り例には縦線などの記号がプロットされますが、生存率が更新されず、グラフが水平に推移していることが分かります。

比例ハザードモデル(Cox回帰分析)を用いると、複数の共変量を用いた分析を行うことができ、患者の背景因子を制御した影響の大きさを調べることができます。複数の変数に基づくこの分析手法は、多変量解析に該当します。

生存時間分析の手法は、最近では機械学習とも統合され、より精度の高い予測が可能になっています。たとえば、ランダムフォレストやニューラルネットワークに生存時間データを組み込むことにより、複雑なパターンを学習し、個々の事象発生確率や生存期間を予測することができます。

Software

ソフトウェア

SPSSでは、Advanced Statisticsオプションが生存時間分析に対応しています。分析メニュー内に「生存分析」が追加され、Kaplan-MeierやCox回帰分析を実行可能です。Rでは、survivalパッケージを使用してKaplan-Meier法を実行します。このパッケージは生存曲線の作成や生存時間の推定をサポートしており、詳細な解析も可能です。ggsurvplotを使えば、美しいグラフも作成できます。Pythonでは、lifelinesscikit-survivalなどのライブラリを使用してKaplan-Meier法を実行します。これらのライブラリは、生存分析に特化しており、Kaplan-Meier曲線の作成や統計的解析を効率的に行えます。

参考文献

  1. Kaplan, E. L., & Meier, P. (1958). “Nonparametric Estimation from Incomplete Observations”Journal of the American Statistical Association, 53(282), 457-481.
  2. Cox, D. R. (1972). “Regression Models and Life-Tables.” Journal of the Royal Statistical Society: Series B (Methodological), 34(2), 187-220.
  3. Hosmer, D. W., Lemeshow, S., & May, S. (2008). “Applied Survival Analysis: Regression Modeling of Time-to-Event Data”Wiley-Interscience.
  4. 対馬 栄輝(2018),SPSSで学ぶ医療系多変量データ解析,東京図書
  5. 中村 剛(2018), 新版 Cox比例ハザードモデル (医学統計学シリーズ 3),朝倉書店
  6. 杉本 知之(2021),生存時間解析 (統計解析スタンダード) ,朝倉書店
PAGE TOP ↑