즉, Overfitting(과적합) 은 많은 feature들이 존재할 때 가설이 학습용 데이터에만 잘 맞춰져 있고 이 데이터에 대해서는 Cost function이
0에 가까운 값으로 나오지만 학습 데이터 외의 새로운 데이터에 대해서는 제대로 예측하지 못하게 되는 문제가 발생한다
현재 과적합인지 아닌지를 알아내는 방법은 이러하다
과적합 문제를 해결하기 위한 방법은 이러하다
feature들 중에서 중복되거나 예측하는데 도움이 안되는 요소들이 존재 할수 있다. 중복이 되는 경우는 하나의 feature로 합치면 되고
도움이 안되는 요소는 판단하여 제거해 줄 수 있다.
두 번째 해결방법으로는 Regularization(정규화) 방법이 있는데 모든 feature들을 남긴채 각각의 특성이 갖는 영향 규모를 줄이는 것이다