Python用データ分析モジュール「Pandas」でデータフレームを生成する方法をソースコード付きで解説します。
データフレーム(DataFrame)の作成
DataFrame(データフレーム)とは、各行・列に対してラベルが付いた2次元配列です。
ラベルでデータの操作ができる点が普通の配列と異なる点です。
そのため、時系列データや統計データの解析によく使われています。
Pandasでは、DataFrameメソッドを用いることで、データフレームを生成できます。
【書式】
dataframe = pandas.DataFrame(data)
サンプルコード(Python)
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import pandas as pd # データフレームの初期化 df = pd.DataFrame({ 'miho' : [158, 82, 56, 84], 'yukari': [157, 78, 58, 83], 'saori' : [157, 85, 60, 86] }) # 表示 print(df) """ miho saori yukari 0 158 157 157 1 82 85 78 2 56 60 58 3 84 86 83 """
miho,saori,yukariは各列のラベルです。
今回は各行のラベルは設定しなかったため、「0, 1, 2, 3」という行ラベルが自動で付加されています。
データフレームと辞書との相互変換
辞書型とDataFrame型の相互変換のサンプルです。
関連ページ
【Pandas入門】使い方とサンプル集
Pythonモジュール「Pandas」でデータ分析する方法についてサンプルコード付きで入門者向けに解説します。
コメント