outlier 제거 (1) 썸네일형 리스트형 파이썬 데이터 이상치(outlier) 제거 방법, 박스플롯(Boxplot) IQR 00. 이상치(Outlier) 데이터 분석을 할 때 데이터 전처리에 많은 시간을 할애하게 된다. 데이터 전처리 단계에서 해야 하는 것은 여러 가지가 있겠지만 그중 데이터 이상치 처리에 대해 정리하고자 한다. 데이터에 이상치가 많이 포함되어 있을 경우, 모델의 성능을 저하시킬 수 있기 때문에 이를 처리해주는 것이 필요하다. (이때, 이상치라고 해서 무조건 제거해야하는것은 아니고 해당 도메인에 맞게 판단하는 것이 필요함) 01. 박스플롯(Boxplot)을 통한 이상치 확인 그렇다면 내가 가지고 있는 데이터셋에 이상치가 있는지 어떻게 확인할 수 있으며 무엇을 기준으로 해당 데이터 값을 이상치라고 판단할 수 있을까? 이를 위해서는 박스플롯(Boxplot)을 알면 좋은데, 위 그림과 같이 상자 수염 도표를 이용하.. 이전 1 다음