可視化ツールの二つのplot
「CSVなどをデータフレームに読み込んで、欲しい形に加工したデータを可視化する」
定番といってもいいくらいよくある作業だとは思います。
ここで登場するのが可視化ツールの代表選手Matplotlibです。
Matplotlib: Visualization with Python
勉強中の方も多いはず。
ところが pandasのデータフレームにもplotメソッドがありグラフが書けてしまいます。
しかもMatplotlibのインポートも必要ありません。
# 変数dfはデータフレームオブジェクトとします df.plot()
これだけでグラフを表示するので便利この上ありません。
データフレームのplotメソッドはMatplotlibラッパー
この二つの関係って初学者から見ると結構悩ましいです。
結論からいうとデータフレームのplotメソッドはMatplotlibのラッパーなので基本的には同じものです。
ではMatplotlibは不要かと言われるとそんなことはありません。
pandasデータフレームのplotメソッドは言わば簡易版Matplotlib。
データを確認する程度の用途なら十分ですが、希望通りのグラフを作ろうとするとMatplotlibが必要になります。
データ加工中はplot()メソッドで、最終のグラフはMatplotlibでといった使い方が適材適所です。
表示できるグラフの種類
- 折れ線グラフ(line)
- 垂直棒グラフ(bar)
- 水平棒グラフ(barh)
- 箱ひげ図(box)
- ヒストグラム(hist)
- カーネル密度推定()
- 面グラフ(area)
- 散布図(scatter)
- 円グラフ(pie)
- hexbin(hexbin)
#グラフの種類を指定(デフォルトが折れ線グラフ) df.plot.bar()