이제까지 다양한 학습 알고리즘을 배웠고 앞으로는 이 학습 알고리즘을 효과적으로 적용하는 방법에 대해서 공부해 보겠다.
집값을 예측하는 문제를 Regularized Linear Regression을 사용할 때의 Cost Function이다. 집값 예측에 대한 성능을 향상시키거나 문제가 발생할
경우 생각할 수 있는 방법은 아래와 같다
Training example을 더 많이 얻는것
Try smaller sets of features
Try getting additional features
Try adding polynomial features
Try decreasing / increasing $\lambda$
일반적으로 위와 같은 방식들 중 직관적으로 골라 적용하게 될 것이다. 하지만 그 선택이 원하는 결과를 반환하지 않을 경우가 생길 수 있다
이러한 시간낭비를 줄이기 위해서 앞으로 Machine Learning Diagnostic 이라는 것을 배울 것이다. 이는 알고리즘이 제대로 동작하는지 하지 못하는지 진단을
해준다 하여 이 같은 이름으로 불리운다. 이 방법을 사용했을때, 시간을 단축시킬 수 있을 것이다. 궁극적인 목표는 기계 학습 시스템을 개선하는 것이다
위와 같은 Data Set이 존재할 때, 먼저 70%,30% 비율로 두 개의 부분으로 나눈다
학습용 데이터는 말그대로 학습을 위한 데이터로, 70%의 크기로 학습을 진행하고 그 이후 과적합에 대한 문제를 판단하기 위하여