과적합(overfitting) (2) 썸네일형 리스트형 [데이터사이언스 면접 질문 모음](1) 과적합(Overfitting) / 불균형 데이터(Imbalanced data)와 샘플링(Sampling) / 활성화 함수(Activation function) / 경사하강법(Gradient descent) / 기울기 소실 문제(Vanishing Gradient.. 01. 과적합(overfitting) 📍과적합(overfitting)이란 무엇이고, 과적합이 발생했을 때 어떠한 방식으로 해결할 수 있는가? '과적합(overfitting)'은 모델이 학습 데이터에만 지나치게 최적화되어, 학습에 사용되지 않은 새로운 데이터에 대해서는 성능이 떨어지는 현상을 의미한다. 예를들어 토익 시험을 보기 위해 한 권의 문제집으로 영어를 공부하는 학생이 있다고 가정한다. 문제집에 나와있는 모든 문제를 거의 외우다시피 공부한 학생은 다시 그 문제집에 있던 문제를 풀었을 때 100점이 나온다(즉, 학습성능이 높다). 하지만 문제집에 없던, 처음 보는 문제들이 가득한 실제 토익 시험에서는 성적이 떨어지게 되고 이를 일반화 성능이 낮다고 표현한다. 이처럼 모델이 주어진 학습데이터만을 너무 .. [머신러닝] 회귀(regression)-2 : 과적합(overfitting), 과소적합(underfitting), 편향 - 분산 트레이트 오프(Bias-Variance Trade off), 가중치 규제(Weight regularization) 1. 과적합(overfitting) 과적합(overfitting)이란, 모델이 학습 데이터에만 너무 잘 맞아서 새로운 데이터에 대한 예측력(일반화)이 떨어지는 것이다. 즉, 학습 데이터를 너무 과하게 학습해서 학습 데이터는 정확하게 맞추지만 실제 데이터에 대해서는 오차가 증가해서 모델을 실제로 사용하기 어려워진 것이다. 과적합은 모델의 파라미터수가 많거나 학습용(train) 데이터 세트의 양이 부족한 경우 발생한다. 특히 다항 회귀에서는 다항식의 차수가 높아질수록 매우 복잡한 피처 간의 관계까지 모델링이 가능해진다. 하지만 다항 회귀의 차수를 높일수록 과적합의 문제가 발생한다. 2. 과소적합(underfitting) 과소 적합(underfitting)은 모델이 너무 단순하여 데이터의 내재된 구조를 학습하.. 이전 1 다음