pivot_table, groupby

2022. 3. 18. 00:27Python

pivot_table

pandas.pivot_table()
# data : 데이터 프레임
# index : 행에 들어갈 조건
# columns : 열에 들어갈 조건
# values : 집계 대상 컬럼 목록
# aggfunc : 집계 함수
  • 데이터를 조건에 따른 변수들의 통계량을 요약한 테이블
  • 행 단위의 데이터 프레임을 피벗 테이블로 변환하는 함수

groupby 

  • 조건부 통계량을 계산하기 위한 방법으로 크게 분할 ,적용, 결합의 세 단계로 구성됨

DataFrame.groupby

  • DataFrame을 분할 기준 컬럼을 기준으로 나누는 함수
df.groupby(분할기준 컬럼)[적용 기준 컬럼].집계합수
# by : 분할 기준 컬럼 (목록)
# as.index : 분할 기준 컬럼들을 인덱스로 사용할 것인지 여부 (default : True)
  • agg 함수 : 여러개의 집계함수나 사용자 정의 함수를 사용할 때

 

> pivot_table 과 groupby

  • 공통점 : 조건부 통계량을 기준으로 집계함
  • 차이점 : 출력물 구조 차이가 존재 : 출력 결과 자체가 결과물인 경우 pivot_table, 중간 산출물인 경우 groupby 사용

'Python' 카테고리의 다른 글

인덱싱  (0) 2022.03.18
데이터 정렬  (0) 2022.03.18
기초 통계 함수  (0) 2022.03.18
데이터 결합 - merge, concat  (0) 2022.03.17
Input / Output  (0) 2022.03.17