Pythonライブラリ「yfinance」と「matplotlib」を使用してオルカン(All Country World Index)とS&P 500の過去5年間の価格を取得し、データを標準化してグラフで比較する方法を解説します。
S&P500とオルカンの価格を標準化してグラフ化
前回の記事「 【Python】S&P500とオルカンの価格を正規化してグラフで比較」では正規化について紹介しました。
今回はS&P500とオルカンの2つの投資信託の価格を標準化してグラフで比較する方法を紹介します。
標準化とは
標準化(Standardization)は、データの平均を0、標準偏差を1に揃える手法です。
標準偏差が1とは、データを標準化したときに分散(標準偏差)が1になることを意味します。
これにより、異なるスケールのデータ(株や投資信託の銘柄)を同じ基準で比較できるようになります。標準化は機械学習や統計分析でよく使われますが、主な特徴は以下のとおりです。
- 比較の容易さ
- 異なるスケールのデータを同じ基準で比較できるため、分析が容易になります。
- 計算の安定性と機械学習モデルの性能向上
- 標準化することで、数値の範囲が一定になるため、計算の安定性が増します。特に線形回帰やサポートベクターマシン(SVM)などのアルゴリズムでは、学習データが標準化されているとモデルの性能が向上することがあります。
標準化の計算式
標準化は以下の計算式で行います。
$ X_{\text{standardized}} = \frac{X – \mu}{\sigma} $
ここで、
- $X$ は元のデータ
- $\mu$ はデータの平均
- $\sigma$ はデータの標準偏差
サンプルコード
以下のコードは、オルカンとS&P 500の過去5年間データを標準化してからグラフ化するものです。
実行結果
標準化することで、オルカンとS&P500の過去5年間の値動きが連動していることがわかります。
関連ページ
Pythonで株・投資信託のデータ分析【超入門】
Pythonを用いて株・投資信託のデータを分析し、値動きを予測する方法をソースコード付きで解説します。
コメント