본문 바로가기

Data Science

[데이터 전처리 기법] Data Binning이란? (bin)

728x90

출처 : http://wisdomschema.com/wp-content/uploads/2015/12/Data_Binning_1-300x189.png

 

 

Data binning이란, 정의된 기준에 따라 각각의 개별적인 데이터값을 특정한 bin(구간, interval) 또는 group으로 묶는 과정을 의미한다

따라서, discrete binning 또는 bucketing이라고도 하는 data binning 은 사소한 관찰 오류의 영향을 줄이는 데 사용되는 데이터 전처리 기술이다. 

주어진 작은 간격인 bin에 속하는 원래 데이터 값이 해당 간격을 대표하는 값(종종 중심 값)으로 대체되는 방식으로 data binning이 이루어진다. 

반응형