可視化ツールの二つのplot

「CSVなどをデータフレームに読み込んで、欲しい形に加工したデータを可視化する」
定番といってもいいくらいよくある作業だとは思います。

ここで登場するのが可視化ツールの代表選手Matplotlibです。

Matplotlib: Visualization with Python

勉強中の方も多いはず。

ところが pandasのデータフレームにもplotメソッドがありグラフが書けてしまいます。
しかもMatplotlibのインポートも必要ありません。

# 変数dfはデータフレームオブジェクトとします
df.plot()

これだけでグラフを表示するので便利この上ありません。

データフレームのplotメソッドはMatplotlibラッパー

この二つの関係って初学者から見ると結構悩ましいです。

結論からいうとデータフレームのplotメソッドはMatplotlibのラッパーなので基本的には同じものです。

ではMatplotlibは不要かと言われるとそんなことはありません。

pandasデータフレームのplotメソッドは言わば簡易版Matplotlib。
データを確認する程度の用途なら十分ですが、希望通りのグラフを作ろうとするとMatplotlibが必要になります。

データ加工中はplot()メソッドで、最終のグラフはMatplotlibでといった使い方が適材適所です。

表示できるグラフの種類

  • 折れ線グラフ(line)
  • 垂直棒グラフ(bar)
  • 水平棒グラフ(barh)
  • 箱ひげ図(box)
  • ヒストグラム(hist)
  • カーネル密度推定()
  •  面グラフ(area)
  • 散布図(scatter)
  • 円グラフ(pie)
  • hexbin(hexbin)
#グラフの種類を指定(デフォルトが折れ線グラフ)
df.plot.bar()