반응형
pandas 내장 그래프 도구
- 그래프를 이용한 시각화 방법은 데이터의 분포와 패턴을 파악하는데 큰 도움이 됩니다.
- 시리즈 또는 데이터 프레임 객체에 plot() 메서드를 적용하고, kind 옵션으로 그래프의 종류를 선택합니다.
* 시각화 할 때 파이그래프는 가급 사용하지 않는것이 좋다.
그래프 생성
▶ 엑셀 파일을 불러옵니다.
df_ = pd.read_excel('./남북한발전전력량.xlsx')
▶ 남한과 북한의 합계량을 불러온뒤 인덱스명을 변경합니다.
df_ns = df_.iloc[[0, 5], 2:].rename({0:"South", 5:"North"})
▶ 컬럼명을 정수형으로 변한하고 전치를 한 뒤 그래프를 생성합니다.
df_ns.columns.map(int)
df_ns.T.plot()
* pd.DataFrame.map & pd.Series.map
- map은 사전에 정의한 내용을 변수에 적용할 수 있는 편리한 기능입니다.
- 머신러닝 모델에 학습하기 전 입력데이터의 형태를 모두 숫자로 변환하기 위해 많이 사용되는 함수 입니다.
▶ 옵션 kind를 변경하여 막대 그래프를 생성합니다.
df_ns.T.plot(kind='bar')
▷ area로 생성.
df_ns.T.plot(kind = 'area')
산점도 (scatter)
▶ x축에 weight, y축에 mpg를 지정하여 산점도를 생성합니다.
df_auto.plot(x = 'weight', y = 'mpg', kind="scatter")
박스 플롯
특정 변수에 데이터 분포와 분산 정도에 대한 정보를 제공합니다.
▶ mpg, cylinders의 데이터를 확인합니다.
df_auto.loc[:, ['mpg', 'cylinders']].plot(kind='box')
반응형
'Python' 카테고리의 다른 글
[Python] Histogram (1) | 2022.09.30 |
---|---|
[Python] 시각화 도구 (0) | 2022.09.28 |
[Python] 데이터 확인 (0) | 2022.09.27 |
[Python] Web scrapping (0) | 2022.09.27 |
[Python] Pandas (0) | 2022.09.27 |