pivot_table, groupby
2022. 3. 18. 00:27ㆍPython
pivot_table
pandas.pivot_table()
# data : 데이터 프레임
# index : 행에 들어갈 조건
# columns : 열에 들어갈 조건
# values : 집계 대상 컬럼 목록
# aggfunc : 집계 함수
- 데이터를 조건에 따른 변수들의 통계량을 요약한 테이블
- 행 단위의 데이터 프레임을 피벗 테이블로 변환하는 함수
groupby
- 조건부 통계량을 계산하기 위한 방법으로 크게 분할 ,적용, 결합의 세 단계로 구성됨
DataFrame.groupby
- DataFrame을 분할 기준 컬럼을 기준으로 나누는 함수
df.groupby(분할기준 컬럼)[적용 기준 컬럼].집계합수
# by : 분할 기준 컬럼 (목록)
# as.index : 분할 기준 컬럼들을 인덱스로 사용할 것인지 여부 (default : True)
- agg 함수 : 여러개의 집계함수나 사용자 정의 함수를 사용할 때
> pivot_table 과 groupby
- 공통점 : 조건부 통계량을 기준으로 집계함
- 차이점 : 출력물 구조 차이가 존재 : 출력 결과 자체가 결과물인 경우 pivot_table, 중간 산출물인 경우 groupby 사용
'Python' 카테고리의 다른 글
인덱싱 (0) | 2022.03.18 |
---|---|
데이터 정렬 (0) | 2022.03.18 |
기초 통계 함수 (0) | 2022.03.18 |
데이터 결합 - merge, concat (0) | 2022.03.17 |
Input / Output (0) | 2022.03.17 |