【Scikit-learn】ロジスティック回帰の使い方・分類

Python用機械学習ライブラリ「scikit-learn」を用いて、ロジスティック回帰する方法をまとめました。

ロジスティック回帰の使い方

ロジスティック回帰とは、説明変数が定量データ、目的変数が2値(あり、なしなど)をとる多変量解析の1つです。
線形回帰を応用(線形回帰の出力をロジット関数に入力)したもので、2分類問題(2値の目的変数をもつ問題)に対して利用します。
2分類問題数とは、例えば「生存・死亡」や「陽性・陰性」を判別するといったものです。

特徴

測定対象:分類
学習タイプ:教師あり
可読性:○
並列処理:✕
※2分類問題に対応した回帰分析です(線形回帰の出力をロジット関数に入力)。

今回はこれをPython用機械学習ライブラリ「scikit-learn」で実装してみます。

動画解説

サンプルコード(Python3)

サンプルプログラムのソースコードです。


input.csv


test.csv


以下のようなルールのデータです。
x1とx2の和が10以上・・・x3は1
x1とx2の和が10未満・・・x3は0

検証結果は、4つともそのように判別していることがわかります。

【Python/scikit-learn】ロジスティック回帰の使い方(L2正則化で過学習の改善・防止)
Pythonモジュール「scikit-learn」でL2正則化により過学習を改善しながらロジスティック回帰分析する方法についてまとめました。
301 Moved Permanently

コメント