スタッツギルド

ロジスティック回帰分析

|

Logistic Regression Analysis

ロジスティック回帰分析

Logistic Regression Analysis

予測する要因を探る分類する
#ロジスティック回帰#二項分類#オッズ比#確率予測#分類分析

二値分類(バイナリ分類)問題に使用される回帰モデルの一種で、従属変数(目的変数)が0または1の二値を取る場合に適用されます。この手法は、従属変数がカテゴリカルであるため、通常の線形回帰が適用できない状況で用いられます。

A type of regression model used for binary classification problems, where the dependent variable (also called the target variable) takes on only two values, typically 0 or 1. This method is used when the dependent variable is categorical, making ordinary linear regression unsuitable.

カテゴリ型の従属変数の要因分析と予測

ロジスティック回帰では、独立変数(説明変数)の値に基づいて、あるイベントが発生する確率を予測します。具体的には、0または1の結果(例:成功/失敗、購入/非購入、合格/不合格など)を予測する際に、その確率が0~1の範囲に収まるようにロジスティック関数(シグモイド関数)が使用されます。

ロジスティック回帰では、従属変数の確率をロジット変換します。ロジット変換は、確率をオッズに変換し、次にそのオッズの対数を取ります。これにより、線形回帰の形を保ったまま、二値分類の問題を解くことができます。

ロジスティック回帰では、各独立変数がオッズ比として解釈されます。オッズ比は、1単位あたりの独立変数の変化が、従属変数の発生確率にどの程度影響を与えるかを示します。

ソフトウェア

SPSSではRegressionオプションやAdvanced Statisticsオプションが対応します。Rでは基本的にstatsパッケージのglm()関数にfamily = binomialを指定してロジスティック回帰を実行します。視覚化にはggplot2パッケージがよく使われます。Pythonでは機械学習ライブラリのscikit-learnLogisticRegressionクラスや、statsmodelsLogit()関数が主要な実行方法として広く使われています。

参考文献

    1. Cox, D. R. (1958). The regression analysis of binary sequences. Journal of the Royal Statistical Society: Series B (Methodological), 20(2), 215-242.
    2. 対馬 栄輝(2018),SPSSで学ぶ医療系多変量データ解析,東京図書
    3. IBM_SPSS_Statistics_Regression.pdf