Python用データ分析モジュール「Pandas」でデータフレームをCSVファイル形式で読み込む方法をソースコード付きで解説します。
データフレームの読込(CSVファイル形式)
Pandasでは、read_csvメソッドを用いることで、データフレームをCSVファイル形式で読み込むことができます。
書式
pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression='infer', thousands=None, decimal='.', ineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=False, error_bad_lines=True, warn_bad_lines=True, skip_footer=0, doublequote=True, delim_whitespace=False, as_recarray=False, compact_ints=False, use_unsigned=False, low_memory=True, buffer_lines=None, memory_map=False, float_precision=None)
【ドキュメント】http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html
引数 | 内容 |
---|---|
filepath_or_buffer | 読み込むCSVファイルのパス |
sep | 区切り文字 |
delimiter | sep の代わりに区切り文字を指定 |
header | ラベル(ヘッダ行)の行数 |
names | ヘッダ行をリストで指定 |
index_col | インデックスとして扱う列番号 |
dtype | 各行のデータタイプ |
skiprows | 先頭から読み込みをスキップする行数 |
skipfooter | 末尾から読み込みをスキップする行数 |
nrows | 読み込む行数 |
quotechar | ダブルクォーテーションなどでクオートされている場合のクオート文字 |
escapechar | エスケープされている場合のエスケープ文字 |
comment | コメント行の行頭文字を指定(指定した文字で始まる行は無視) |
index | 行名も保存するか否か |
encoding | 文字コード(’utf-8′, ‘shift_jis’, ‘euc_jp) |
サンプルプログラムのソースコードは下記の通りです。
表示されない場合は、「https://github.com/nishizumi-lab/sample/blob/master/python/pandas/file/read_csv.py」をご覧ください。
■data2.csv
https://github.com/nishizumi-lab/sample/blob/master/python/pandas/csv/data2.csv
データフレームの保存(CSVファイル形式)
Pandasでは、to_csvメソッドを用いることで、データフレームをCSVファイル形式で保存できます。
書式
DataFrameObj.to_csv(path_or_buf=None, sep=', ', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression=None, quoting=None, quotechar='"', line_terminator='\n', chunksize=None, tupleize_cols=False, date_format=None, doublequote=True, escapechar=None, decimal='.')
引数 | 内容 |
---|---|
path_or_buf | 保存するCSVファイル名 |
sep | 区切り文字 |
index | 行名も保存するか否か |
encoding | 文字コード(’utf-8′, ‘shift_jis’, ‘euc_jp) |
サンプルプログラムのソースコードは下記の通りです。
# -*- coding: utf-8 -*- import pandas as pd # データフレームの初期化 df = pd.DataFrame({ '名前' : ['西住みほ', '秋山優花里', '武部沙織', '五十鈴華', '冷泉麻子'], '身長' : [158, 157, 157, 163, 145]}, index = ['車長', '装填手', '通信手', '砲手', '操縦手'] ) # ファイル出力 df.to_csv("anko.csv")
サンプルプログラムの実行結果です。
【生成したanko.csv】
,名前,身長 車長,西住みほ,158 装填手,秋山優花里,157 通信手,武部沙織,157 砲手,五十鈴華,163 操縦手,冷泉麻子,145
【Pandas】データフレームの保存(CSVファイル形式)
Python用データ分析モジュール「Pandas」でデータフレームをCSVファイル形式で保存する方法をソースコード付きで解説します。
Excelファイルの書き込み
Python + Pandasでは、to_excelメソッドで簡単にExcelファイルを書き込めます。
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import pandas as pd # データフレームの初期化 df = pd.DataFrame({ '名前' : ['西住みほ', '秋山優花里', '武部沙織'], '身長' : [158, 157, 157]}, index = ['車長', '装填手', '通信手'] ) # データフレームをExcelファイルに書き込む df.to_excel("test.xlsx")
【Pandas】Excelファイルの書き込み(出力)
Python(Pandas)でExcelファイルを書き込む方法とサンプルコードを入門者向けにまとめました。
Excelファイルのグラフ化
Pythonモジュール「Pandas」で読み込んだExcelのデータを「Matplotlib」でグラフ化してみました。
サンプルプログラムのソースコードです。
# -*- coding: utf-8 -*- import pandas as pd import matplotlib.pyplot as plt def main(): # Excelファイルの読み込んでデータフレームに格納 df = pd.read_excel("input.xlsx") # ラベル毎の値を取り出し numbers = df['受験番号'].values maths = df['数学'].values englishs = df['英語'].values # グラフ化 plt.plot(numbers, maths) plt.plot(numbers, englishs) plt.grid() plt.show() if __name__ == "__main__": main()
サンプルプログラムの実行結果です。
■読み込んだExcelファイルの中身
■グラフ
【Python/Pandas】Excelファイルのグラフ化
Pythonモジュール「Pandas」で読み込んだExcelのデータを「Matplotlib」でグラフ化する方法をソースコード付きで解説します。
【Pandas入門】使い方とサンプル集
Pythonモジュール「Pandas」でデータ分析する方法についてサンプルコード付きで入門者向けに解説します。
コメント