この記事では、Python用データ分析モジュール「Pandas」でデータフレームの基本統計量を計算・確認する方法をソースコード付きで解説します。
データフレームの基本統計量
Pandasでは、describeメソッドを用いることで、データフレームから以下の基本統計量を一括で求めることができます。
【基本統計量】
count・・・件数
mean・・・平均値
std・・・標準偏差
min・・・最小値
25%・・・第一四分位数
50%・・・中央値
75%・・・第三四分位数
max・・・最大値
ソースコード
サンプルプログラムのソースコードは下記の通りです。
実行結果
サンプルプログラムの実行結果は下記の通りです。
身長
count 3.000000
mean 157.333333
std 0.577350
min 157.000000
25% 157.000000
50% 157.000000
75% 157.500000
max 158.000000
非常に便利な機能です。
【おすすめ記事】
【Pandas入門】データ分析のサンプル集
Python入門 基本文法
コメント