【Pandas】データフレーム(DataFrame)の作成

Python用データ分析モジュール「Pandas」でデータフレームを生成する方法をソースコード付きで解説します。

データフレーム(DataFrame)の作成

DataFrame(データフレーム)とは、各行・列に対してラベルが付いた2次元配列です。
ラベルでデータの操作ができる点が普通の配列と異なる点です。
そのため、時系列データや統計データの解析によく使われています。

Pandasでは、DataFrameメソッドを用いることで、データフレームを生成できます。

【書式】

dataframe = pandas.DataFrame(data)

サンプルコード(Python)

サンプルプログラムのソースコードです。

# -*- coding: utf-8 -*-
import pandas as pd

# データフレームの初期化
df = pd.DataFrame({
        'miho'  : [158, 82, 56, 84],
        'yukari': [157, 78, 58, 83],
        'saori' : [157, 85, 60, 86]
})

# 表示
print(df)
"""
    miho  saori  yukari
0   158    157     157
1    82     85      78
2    56     60      58
3    84     86      83
"""

miho,saori,yukariは各列のラベルです。
今回は各行のラベルは設定しなかったため、「0, 1, 2, 3」という行ラベルが自動で付加されています。

データフレームと辞書との相互変換

辞書型とDataFrame型の相互変換のサンプルです。


関連ページ

【Pandas入門】使い方とサンプル集
Pythonモジュール「Pandas」でデータ分析する方法についてサンプルコード付きで入門者向けに解説します。

コメント