인덱싱
2022. 3. 18. 01:11ㆍPython
indexing
- loc 인덱서 : 명시적인 인덱스 참조 (loc를 이용한 슬라이싱에서는 맨 뒤 값 포함O )
- iloc 인덱서 : 암묵적인 인덱스 참조 (iloc를 이용한 슬라이싱에서는 맨 뒤 값 포함X )
비교연산
- Series와 DataFrame 데이터 타입은 모두 ndarray이므로 비교연산 및 브로드캐스팅 적용 가능
부울 리스트 연산
- ndarray 타입의 부울 리스트에 대해 AND연산(&)과 OR연산(|)이 가능
마스킹 검색
df.loc[부울 리스트]
- True인 요소의 위치에 대응되는 행만 가져옴
Series.str
- 문자열로 구성된 Series에 대해서는 str accessor를 사용할 수 있으며, 이를 사용하면 string 관련 내장함수 사용 가능
- Series.str.strip() : 앞 뒤 공백제거
- Series.str.contains(s) : 문자열 s를 포함하고 있는지 여부를 반환
- Series.str.split(sep, expand) : sep을 기준으로 Series를 분할
(expand - True : 새로운 열 생성 , False : 새로운 열을 생성하지 않고 리스트를 반환)
Series.astype
Series.astype()
- Series의 자료형을 변환하는데 사용