본문 바로가기

Data Science/Machine Learning

[sklearn] train_test_split

728x90

옵션 값 설명

  • test_size (default : 0.25): 테스트 셋 구성의 비율, train_size의 옵션과 반대 관계에 있는 옵션 값
  • shuffle (default=True) : split을 해주기 이전에 shuffle을 진행할지 여부
  • stratify (default=None) : classification 문제에서 지정한 stratify 값을 기준으로 class 비율(ratio)을 train / validation에 유지해줌 (class imbalance 해결) 
  • random_state: 매번 데이터셋이 변경되는 것을 방지하도록 사용한 랜덤 split 방식을 고정시킬 수 있음
반응형