반응형

apply() 2

[Python] 그룹연산

그룹연산 특정 기준을 적용하여 몇 개의 그룹으로 분할하여 처리하는 것. 복잡한 데이터를 어떤 기준에 따라 여러 그룹으로 나눠서 관찰하기에 좋습니다. 데이터를 집계, 변환, 필터링하는데 효율적입니다. ▷ 그룹연산의 단계 split(분할) : 데이터를 특정 조건에 의해 분할. apply(적용) : 데이터를 집계, 변환, 필터링하는데 필요한 메서드를 적용합니다. combine(결합) : 2단계의 처리 결과를 하나로 결합합니다. ▶ groupby() 데이터프레임의 특정 컬럼을 기준으로 데이터프레임을 분할하여 그룹 객체를 반환합니다. 기준이 되는 컬럼은 1개도 가능하며 여러 컬럼을 리스트로 입력도 가능합니다. DataFrame.groupby() 분할 단계 ▷ 데이터를 가져옵니다. df_t1 = sns.load_d..

Python 2022.10.06

[Python] Function Mapping

Function Mapping (함수 매핑) 시리즈 또는 데이터 프레임의 개별 원소를 특정 함수에 1:1 대응시키는 과정 사용자가 직접 만든 함수를 적용. 판다스 기본 함수로 처리하기 어려운 복잡한 연산을 처리. ▷ apply() VS applymap() applymap() 은 시리즈 객체를 사용할 수 없습니다. 다수의 컬럼의 원소를 처리 할 때 applymap()이 빠르나 체감할 정도는 아닙니다. 시리즈 객체의 데이터를 처리 할 때 apply()를 사용 할 수 있습니다. * apply() 사용을 권장합니다. ▶ 새로운 데이터 프레임을 생성합니다. titanic2 = titanic.loc[:, ['age', 'fare']] titanic2['ten'] = 10 ▶ 함수를 생성합니다. add_10 = la..

Python 2022.10.06
반응형