Python

[Python] pandas 내장 그래프 도구

SangRok Jung 2022. 9. 27. 23:27
반응형

pandas 내장 그래프 도구 


  • 그래프를 이용한 시각화 방법은 데이터의 분포와 패턴을 파악하는데 큰 도움이 됩니다.
  • 시리즈 또는 데이터 프레임 객체에 plot() 메서드를 적용하고, kind 옵션으로 그래프의 종류를 선택합니다.

 

 

* 시각화 할 때 파이그래프는 가급 사용하지 않는것이 좋다.

 

 

 

 

 

그래프 생성


 

▶ 엑셀 파일을 불러옵니다.

df_ = pd.read_excel('./남북한발전전력량.xlsx')

 

 

 

 

▶ 남한과 북한의 합계량을 불러온뒤 인덱스명을 변경합니다.

df_ns = df_.iloc[[0, 5], 2:].rename({0:"South", 5:"North"})

 

 

 

 

▶ 컬럼명을 정수형으로 변한하고 전치를 한 뒤 그래프를 생성합니다.

df_ns.columns.map(int)

df_ns.T.plot()

 

* pd.DataFrame.map & pd.Series.map

  • map은 사전에 정의한 내용을 변수에 적용할 수 있는 편리한 기능입니다.
  • 머신러닝 모델에 학습하기 전 입력데이터의 형태를 모두 숫자로 변환하기 위해 많이 사용되는 함수 입니다.

 

 

 

전치 하기 전 의 그래프
전치 후 그래프

 

 

▶ 옵션 kind를 변경하여 막대 그래프를 생성합니다.

df_ns.T.plot(kind='bar')

▷ area로 생성.

df_ns.T.plot(kind = 'area')

 

 

 

 

 

산점도 (scatter)


▶ x축에 weight, y축에 mpg를 지정하여 산점도를 생성합니다.

df_auto.plot(x = 'weight', y = 'mpg', kind="scatter")

 

음의 상관관계가 있다.

 

 

 

 

 

 

박스 플롯


특정 변수에 데이터 분포와 분산 정도에 대한 정보를 제공합니다.

 

 

▶ mpg, cylinders의 데이터를 확인합니다.

df_auto.loc[:, ['mpg', 'cylinders']].plot(kind='box')

 

반응형

'Python' 카테고리의 다른 글

[Python] Histogram  (1) 2022.09.30
[Python] 시각화 도구  (0) 2022.09.28
[Python] 데이터 확인  (0) 2022.09.27
[Python] Web scrapping  (0) 2022.09.27
[Python] Pandas  (0) 2022.09.27