PythonのJSONファイルの読み込み、書き込み、解析(パース)を行う方法をソースコード付きで解説します。
JSONファイルの読み込みと書き込み(出力)
JSON(JavaScript Object Notation)とは、JavaScript言語のオブジェクト表記法をベースとしたテキスト形式のデータファイルです。
XMLと比べて簡潔に構造化データを記述できます。
そのため、Webサービスなどよく利用されています。
Pythonでは標準モジュール「json」等でJSON形式のデータファイルを扱うことができます。
JSON形式ファイルの書式は次の通りです。
書式
{キー1:要素1, キー2:要素2,…}
よって、Pythonの辞書とJSON形式はほとんど同じなものです。
例
{ "西住":{ "height": 158 , "position": "車長" }, "秋山":{ "height": 157 , "position": "装填手" } }
サンプルコード①JSONファイルの読み込み、データ抽出、書き込み
Pythonの標準モジュール「json」を用いて、JSON形式ファイルのロードします。
ロードしたデータは辞書型なので、キーを指定することで要素を取り出せます。
data.json
読み込んだJSONファイルです。
補足
Windows環境を使用しているとjson.loadメソッドが「デフォルトでcp932でコーディング」されます。
そのため、UTF-8のJSONファイルを読み込み時は、UTF-8でコーディングする様にjson.loadメソッドに引数で指定します。
■参考:【Python/json】「UnicodeDecodeError: ‘cp932’ codec can’t decode~」エラーの対処方法
また、json.dumpsで、「ensure_ascii=False」を指定することで出力されるJSONファイルの文字コードがUTF-8となり日本語の文字化けを回避できます。
サンプルコード②CSV → JSONに変換
Pythonモジュール「Pandas」ではread_jsonメソッドでJSONファイルを読み込み、to_csvメソッドでCSVに変換して保存できます。
JSONからCSVに変換するソースコードです。
# -*- coding: utf-8 -*- import pandas as pd # JSONファイルを読み込む df = pd.read_json("C:progpython\testdata.json", encoding="UTF-8") # CSVに変換して保存 df.to_csv("C:progpython\testdata.csv", encoding="UTF-8")
CSV → JSON
CSVからJSONに変換するソースコードです。
# -*- coding: utf-8 -*- import pandas as pd # CSVファイルを読み込む df = pd.read_csv("C:progpython\testdata.csv", encoding="UTF-8") # JSONに変換して保存 df.to_json("C:progpython\testdata.json")
■data.json
{ "西住":{ "height": 158 , "position": "車長" }, "秋山":{ "height": 157 , "position": "装填手" } }
■data.csv
,西住,秋山 height,158,157 position,車長,装填手
コメント