[빅분기] 작업형2 - RandomForest

[빅분기] 작업형2 - RandomForest

2022. 6. 22. 19:16ㆍ카테고리 없음

데이터 할당 : train, test, y

Null 여부 확인 ->

train 데이터 num , cat 분류

cat 데이터 원핫인코딩 실시 -> X_cat = pd.get_dummies(X_cat)

test 데이터 num , cat 분류

cat 데이터 원핫인코딩 실시

X_cat을 기준으로 정렬 : align

X_cat, test_cat = X_cat.align(test_cat, join='inner',axis=1)

MinMaxScaler

랜덤포레스트 모델 적용 ( 분류 OR 회귀)

from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor()
model.fit(X_final, y)

pred_test = model.predict(test_final)
pred_test_prob = pd.DataFrame(pred_test,columns=['predict_prob'])
final_predict = pd.concat([test['ID'], pred_test_prob],axis=1) 

final_predict.to_csv('2-3.csv',index=False)

For Data Analysis

For Data Analysis

태그

최근글

댓글

공지사항

아카이브

데이터 할당 : train, test, y

티스토리툴바