Python(22)
-
기초 통계 함수
기초 통계 함수는 DataFrame와 Series에 정의되어 있음 sum() : 합계 mean() : 평균 std() : 표준편차 var() : 분산 quantile() : 사분위수 계산 min() : 최소값 max() : 최대값 Axis 키워드 axis 설정을 통해 행별, 열별 기초 통계를 구할 수 있음 축의 방향을 결정하는 역할 axis=0 : 행 , 1: 열 함수의 결과 구조의 형태에 따라 역할이 다름 describe 함수 describe() 열별로 대표적인 기초 통계를 반환 (count, mean, std, min, 25%, 50%, 75%, max)
2022.03.18 -
데이터 결합 - merge, concat
pandas.merge : key 변수를 기준으로 두 개의 데이터 프레임을 병합(join)하는 함수 left : 통합 대상 데이터 프레임1 right : 통합 대상 데이터 프레임2 on : 통합 기준 key 변수 및 변수 리스트 (미입력시 이름이 같은 변수를 key로 식별) left_on : 데이터 프레임1의 key 변수 및 변수 리스트 righr_on : 데이터 프레임2의 key 변수 및 변수 리스트 left_index : 데이터 프레임1의 인덱스를 key로 사용할 지 여부 right_index : 데이터 프레임2의 인덱스를 key로 사용할 지 여부 left_on, right_on을 사용한 데이터 통합 # 컬럼명을 바꿔도 똑같이 작동함 merged_df = pd.merge(df1, df2, left_o..
2022.03.17 -
Input / Output
I/O (Input / Output) 프로그램 입장에서 들어오는 모든 데이터를 input, 나가는 모든 데이터를 output이라고 함 사용자로 부터 키보드로 입력받는 것을 stdin이라고 하며, 사용자에게 다시 모니터로 출력되는 것을 stdout이라고 함 file I/O : 스토리지와 프로그램 사이의 I/O STDIN / STDOUT (Standard IN, Standard OUT) stdin : input()을 통해 사용자로부터 입력받음 stdout : print()를 통해 사용자에게 출력 stdin은 무조건 문자열 타입 입력받는 값을 숫자라고 가정한 경우 : int 함수 이용! a = int(input("숫자를 입력하세요 : ")) # type casting, (명시적) 타입 변환 a, type(a)..
2022.03.17 -
데이터 불러오기, 저장하기
경로 확인하기 및 설정하기 파이썬에서 데이터를 불려오려면 반드시 경로와 확장자까지 포함해서 불러와야함 os.getcwd() : 현재 경로를 반환 os.chdir(path) : 현재 경로를 path로 설정 > 역슬래시(\)는 특별한 표현이 아님을 나타내야 함 역슬래시 두 번 사용 : "path\\path" 역슬래시를 슬래시로 변경 : "path/path" r을 사용하여 raw string임을 밝힘 : r"path\path" open 함수를 이용한 파일 불러오기 파일객체 = open(파일 경로 및 이름 , 모드) 정제되지 않은 형태의 데이터를 불러오는 경우에 주로 사용 모드에는 r(read), w(write), a(add)가 있음 파일 객체 사용후 close 함수를 사용하여 닫아줘야 함 (cf. with 구..
2022.03.17