[빅분기] 머신러닝
1. 데이터 검토 pandas 라이브러리 임포트 import pandas as pd 파일 불러오기 data = pd.read_csv('breast-cancer-wisconsin.csv') 데이터 확인 : y값의 범주형 여부 확인 ,이상치 여부 확인 data.info() data.head() print(data.shape) data.describe data.hist(bins=50, figsize=(20,15)) 2. x, y 나누기 X = data[data.columns[0:5]] y = data[['house_value']] print(X.shape) print(y.shape) 3. train-test 데이터 셋 나누기 라이브러리 임포트 from sklearn.model_selection import t..
2022.06.13