학습내용훈련 세트의 분포와 개발 세트의 분포의 차이 때문에 오차가 커진 것인지 아니면 일반화가 부족해서 생긴 분산 문제인지 구별하기가 어렵습니다. 훈련-개발 세트는 훈련 세트 중 일부를 떼어내서 전자의 문제를 알아보기 위한 도구입니다.따라서 훈련-개발 세트의 오차가 훈련 세트와 크게 차이가 없다면, 분산 문제라고 볼 수 있습니다. 그러나 훈련-개발 세트와 개발 세트의 오차 차이가 크다면, 데이터 분포의 차이 문제입니다.각각의 데이터 세트에 대해 어떤 문제가 있는지 아래의 그림을 참고하시길 바랍니다.
comment
학습 내용이 수정이 됬는지는 모르겠지만,
영상 내용과 학습 내용 간에 안맞는 내용이 어딘지는 안보이네요
제가 이해하기로는 학습 내용을 올바르게 작성한 것 같습니다
학습 내용에 설명이 영상 내용과 조금 맞지 않은 듯 합니다. 참고하세요~!