Pythonモジュール「Pandas」でデータ分析する方法についてサンプルコード付きで入門者向けに解説します。
Pandasとは
Pandas(読み:パンダス)は、Python用のデータ分析用ライブラリです。
他のデータ分析ライブラリと比較したときのPandasの大きな特徴は「R言語やSQLのように、表形式のデータを高速に操作できる」点です。
例えば、以下のような時系列データを扱う場合はPandasで扱うと便利です。
– | 気温 | 湿度 | 天候 |
---|---|---|---|
2019-01-01 | 10.1 | 52.3 | 晴 |
2019-01-02 | 8.2 | 41.8 | 晴 |
2019-01-03 | 9.1 | 54.2 | 曇 |
上記のような表をPandasでは、Dataframe(データフレーム)と呼ばれるデータ型で扱います。
Dataframeには「2次元のデータ」と「行・列のラベル」があります。
行ラベル(インデックスラベル:indexs)・・・上記の表だと、2019-01-01、2019-01-02、2019-01-03
列ラベル(columns)・・・上記の表だと、気温、湿度、天候
Pandasの基本操作
- 環境構築
- SeriesとDataFrame
- DataFrameの操作
- 時間軸の操作
- ファイル処理
- 可視化(グラフ化)
- 統計処理
【応用例】株価分析
- 事前準備
- 移動平均線
- GC・DC(ゴールデンクロス・デッドクロス)
- ボリジャーバンド
- 周波数解析
- 多変量解析
- チャート
- 相関
401 Unauthorized
【応用例】信号データの波形解析
- 電気信号の解析
- モデル式の算出
- ノイズ除去
参考文献、関連ページ
- 無料で使える統計データ
- 無料で統計処理を学べるサイト
【Python超入門】使い方とサンプル集
Pythonの基礎文法から応用例まで入門者向けに解説します。