Pythonモジュール「Pandas」でカテゴリ変数をダミー変数に変換する方法をソースコード付きで解説します。
カテゴリ変数をダミー変数に変換
Pythonモジュール「Pandas」でカテゴリ変数をダミー化するには「pd.get_dummies」メソッドを用います。
サンプルコード(Python3 + Pandas)
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import pandas as pd # CSVァイルを読み込んでデータフレームに格納 df = pd.read_csv("input.csv") # ラベル毎の値を取り出し df = pd.get_dummies(df) print(df)
入力データ
input.csv
満足度,性別,文理 5,男,理系 3,女,理系 4,男,文系 1,女,文系 2,男,文系
実行結果
満足度 性別_女 性別_男 文理_文系 文理_理系 0 5 0 1 0 1 1 3 1 0 0 1 2 4 0 1 1 0 3 1 1 0 1 0 4 2 0 1 1 0
カテゴリ変数(性別、文理)のみがダミー変数に変換されました。
コメント