본문 바로가기

사이킷런 train_test_split

(1)

[머신러닝] 모델링 과정 (sklearn/ trainning set & test set / Pipeline / GridSearchCV / model.fit / best_estimator_ / Y_train_pred / Y_test_pred /classification_report ) 01. X(설명 변수)와 Y(목표 변수) 설정 Y = df[' '] X = df[' '] 먼저 전체 데이터에서 목표 변수(Y)와 설명 변수(X)를 설정하여 나눈다. 02. Trainning set(학습 데이터) & Validation set(검증 데이터)으로 분할 X_train, X_test, Y_train, Y_test = train_test_split(X,Y, test_size = 0.3, random_state =1234) X와 Y로 나눈 데이터를 train_test_split( )을 이용하여 train set과 test set으로 분할한다. train_test_split( )의 파라미터들을 살펴보자. test_size는 '전체 데이터에서 테스트 데이터 세트의 크기를 얼마로 샘플링할 것인가?'를 의..

이전 1 다음

티스토리툴바