로그인 바로가기 하위 메뉴 바로가기 본문 바로가기
난이도
기본

딥러닝을 이용한 자연어 처리

임시 이미지 조경현 교수
http://www.boostcourse.org/ai331/forum/139084
좋아요 776 수강생 7827

문장 생성시 다양성은 어떻게 해결하나요?

처음에 문제를 설정하는 방법이 텍스트 스코어링이랑 텍스트 제너레이션이랑 같다고 하셨는데요...그러면은 그냥..예를 들어서 사람이 있다고 치면 모두다 같은 문장만 말하게 되는게 아닌가요? 약간 문장의 다양함이 좀 사라질거 같은데...세팅을 그렇게 하면. 항상 높은거만 말하게 되니까요.

(조경현 교수님 답변입니다)
아, 그렇죠. 그..그..제너레이션이...제가 말한거는 이제 디터미니스틱한 제너레이션을 얘기했던건데 이것도 또한 스코어테스틱한 제너레이션으로 바꿀 수 있겠죠. 스코어를 모든 가능한 센텐스 들에다가 스코어를 다 매긴다음에 프라버블리티로 만들어주는 거죠. 그걸 프라버블리티로 만들려면은 그냥 다 넌레거리티브하게 만들고, 그 다음에 썸이 1이 되도록 만들 수 있겠죠. 만든 다음에는 거기서 샘플링을 할 수 있으니까요. 샘플링을 하게 되면은 라이클리어한 센텐스들이 더 많이 나오겠죠. 그렇게 함으로써 바이블러스티를 줄일 수 있죠.