로그인 바로가기 하위 메뉴 바로가기 본문 바로가기
난이도
기본

딥러닝을 이용한 자연어 처리

임시 이미지 조경현 교수
http://www.boostcourse.org/ai331/forum/139099
좋아요 776 수강생 7827

Universal linguistic semantic space가 존재할까요?

제가 평소에 멀티 랭귀지 트랜스레이션에 관심이 많았는데 좀 의문이 드는게 한국어에서 굉장히 결과가 안좋았잖아요. 사실은 이 가정이 되는 유니버설한 시멘틱 스페이스가 있다는걸 바탕으로 하는건데 그게 사실은 없으니까 안되는게 아닐까 하는 생각이 들었어요. 왜냐하면 이제 결국에는 이제 링귀스틱 시멘틱한 랭귀지들은 이제 익스플레이트하는게 아닌가 그냥 그런생각이 드는데 어떻게 생각하시는지 좀 궁금합니다.

(조경현 교수님 답변)

네 저도 유니버설한 그런 인털링궈 같은건 없는거 같구요 제가보기에도. 저는 없다고 보고요. 여기서 한가지 생각해봐야되는게 지금 저희가 소스랭귀지 쓴거 보면은 다 유러피안 랭귀지들만 썼거든요. 뭐 러시안 슬라비안 랭귀지 있긴한데 다 인도유러피안 랭귀지들을 쓰고 보면은 루매니안도 어쨌든 유러피안 로망스 랭귀지쪽이고 라트비안이 쫌 특이하긴한데 얘도 뭐 러시안이랑 저머니랑 이런거하고 비슷하고요. 피니쉬가 전혀 다른거 같지만 토큰같은거 단어들 보면은 그 론월드들이 많이 가지고 사실 비슷한게 꽤 있고요.
터키쉬에 또 달라도 은근 또 터키쉬에도 좀 비슷한 스트럭쳐가 비슷한 랭귀지들이 여기 몇개 있어요.
근데 코리안이 비슷한게 별로 없거든요. 랭귀지 아이솔렛이라서 비슷한 언어가 그렇게 많지도 않고 1번으로.
여기서 저희가 선택한 솔스 랭귀지 페어가 특히나 한국어랑은 동떨어진애들이 많죠. 그니가 여기서 결론을 내릴 수 있는게 둘중에 하난데요. 한국어가 한국어 트랜스레이션하는게 어렵다가 결론일수도 있구요.
그게아니라 솔스 타스크 선택 랭귀지 페어 선택한게 한국어랑은 잘 맞지않는다 라고도 볼 수 있어서 정확히 이것만 보고 지금 뭐 유니버설 스멘틱 스페이스가 없어서 이런거냐 있어서 이런거냐 답하긴 힘든거 같습니다. 훨씬 더 연구나 실험을 해봐야할거 같습니다.