문장 생성시 다양성은 어떻게 해결하나요?
처음에 문제를 설정하는 방법이 텍스트 스코어링이랑 텍스트 제너레이션이랑 같다고 하셨는데요...그러면은 그냥..예를 들어서 사람이 있다고 치면 모두다 같은 문장만 말하게 되는게 아닌가요? 약간 문장의 다양함이 좀 사라질거 같은데...세팅을 그렇게 하면. 항상 높은거만 말하게 되니까요.
(조경현 교수님 답변입니다)
아, 그렇죠. 그..그..제너레이션이...제가 말한거는 이제 디터미니스틱한 제너레이션을 얘기했던건데 이것도 또한 스코어테스틱한 제너레이션으로 바꿀 수 있겠죠. 스코어를 모든 가능한 센텐스 들에다가 스코어를 다 매긴다음에 프라버블리티로 만들어주는 거죠. 그걸 프라버블리티로 만들려면은 그냥 다 넌레거리티브하게 만들고, 그 다음에 썸이 1이 되도록 만들 수 있겠죠. 만든 다음에는 거기서 샘플링을 할 수 있으니까요. 샘플링을 하게 되면은 라이클리어한 센텐스들이 더 많이 나오겠죠. 그렇게 함으로써 바이블러스티를 줄일 수 있죠.
comment