머신러닝 변수 선택 (1) 썸네일형 리스트형 [통계] Feature selection - 변수 선택방법 (전진 단계적 선택 / 후진 단계적 선택 / 하이브리드 방식) 00. 관측치의 수(n)과 변수의 수(p) 1) n의 수와 p의 수가 비슷한 경우 - 최소제곱적합에 많은 변동이 존재할 수 있어, 과적합 발생, 일반화 성능 떨어질 수 있음 2) n > p - 최소제곱 추정치들은 낮은 분산을 가지는 경향이 있고, 따라서 검정 관측치에 대해서도 좋은 성능을 낼 것임 3) n < p - 더 이상 유일한(unique) 최소 제곱 계수 추정치가 존재하지 않는다. 즉, 분산이 무한대가 되어 최소제곱 방법을 전혀 사용할 수 없게 됨 01. 설명변수와 목적변수 설명변수(X) 목적변수(y) - 독립 변수(Independent variable) - 예측 변수(Predictor variable) - 원인 변수 - 조작 변수(mulipulated variable) - 통제 변수(contro.. 이전 1 다음