데이터 사전처리 ▶ 누락 데이터 처리 데이터 프레임에는 원소 데이터 값이 누락되는 경우가 발생합니다. 데이터를 입력할 때 빠트리거나 파일 형식을 변환하는 과정에서 데이터가 소실되는 것이 주요 원인입니다. 일바반적으로 유효한 데이터 값이 존재하지 않는 누락 데이터를 NaN(Not a Number)으로 표시합니다. 머신러닝 모델에 데이터 입력 전 반드시 누락 데이터 제거 혹은 다른 적절한 값으로 대체하는 과정이 필요합니다. 누락 데이터가 많아지면 데이터의 품질이 떨어지고 머신러닝 분식 알고리즘을 왜곡하는 현상이 발생합니다. ▶ 데이터를 불러옵니다. import pandas as pd import seaborn as sns df = sns.load_dataset('titanic') ▶ nan값을 확인합니다. ..