학습목표얼굴 인식이 어떻게 이진 분류 문제로 바로 표현되는 법을 배운다.핵심키워드얼굴 인식 (face recognition)얼굴 검증 (face verification)이진 분류 (binary classification)로지스틱 회귀 (logitstic regression)
\hat{y} = \sigma \big( \displaystyle \sum_{k=1}^{128} w_i \vert f(x^{(i)})_k - f(x^{(j)})_k \vert + b \big) y^=σ(k=1∑128wi∣f(x(i))k−f(x(j))k∣+b) 로지스틱의 역할은 두 이미지가 같은 사람인지 아닌지 판단하는 것입니다. 두 인코딩간의 차이는 여러가지 방식으로 구할 수 있습니다.훈련세트도 한 쌍의 이미지로 만듭니다. 같은 사람일 경우 라벨을 1로 지정하고, 다를 경우 0으로 만듭니다.
DeepFace: Closing the Gap to Human-Level Performance in Face Verification https://www.cs.toronto.edu Yaniv Taigman, 2014샴 네트워크의 논문입니다.
comment
직관적으로 생각했을 때 샴 네트워크가 binary다보니 triplet보다 데이터를 얻기도 쉽고 학습도 단순해보이는데 두 모델의 성능차이가 많이 큰 편인가요? 굳이 triplet의 대안이 샴인 이유가 궁금하네요!