【Python/Pandas】カテゴリ変数をダミー変数に変換

Pythonモジュール「Pandas」でカテゴリ変数をダミー変数に変換する方法をソースコード付きで解説します。

カテゴリ変数をダミー変数に変換

Pythonモジュール「Pandas」でカテゴリ変数をダミー化するには「pd.get_dummies」メソッドを用います。

サンプルコード(Python3 + Pandas)

サンプルプログラムのソースコードです。

# -*- coding: utf-8 -*-
import pandas as pd

# CSVァイルを読み込んでデータフレームに格納
df = pd.read_csv("input.csv")

# ラベル毎の値を取り出し
df = pd.get_dummies(df)

print(df)

入力データ

input.csv

満足度,性別,文理
5,男,理系
3,女,理系
4,男,文系
1,女,文系
2,男,文系

実行結果

   満足度  性別_女  性別_男  文理_文系  文理_理系
0    5     0     1      0      1
1    3     1     0      0      1
2    4     0     1      1      0
3    1     1     0      1      0
4    2     0     1      1      0

カテゴリ変数(性別、文理)のみがダミー変数に変換されました。

コメント