- 공유 링크 만들기
- X
- 이메일
- 기타 앱
Paper Overview
Abstract
이 논문은 zero-shot classification (ZSC) task를 다루고 seen class를 사용하여 conditoinal generator를 학습한 뒤 unseen example을 생성하는 논문이다.
이때 저자들은 4가지의 generative model을 비교 분석한다.
Introduction
기존 ZSC 알고리듬은 zero-shot 예측 함수를 정의함으로써 classification을 수행한다.
이 zero shot 예측함수로 image $x$에 대해 maximum compatibility score를 구하여 class $y$를 구한다: $f(x) = \text{argmax}_{y}S(x,y)$.
compatibility function이란 $S(x,y;W) = \theta(x)^{t}W\phi(y)$로 정의되는 함수로 $W$는 $x$ feature와 $y$ embedding을 common embedding space에 사영하는 bilinear function이다.
그러나 이러한 방법은 semantic representation이 가지고 있는 잠재적인 정보를 활용하지 않는다.
저자들은 위와 같이 class attribute와 noise로 unseen class exampler를 생성한 뒤 해당 exampler를 통해 classifier를 학습한다.Approach
1. Zero shot classification
zero-shot 학습에서 사용가능한 데이터를 seen class라고 묶는다.
이때 unseen class에 해당하는 데이터를 사용하지 않는 세팅을 inductive라고 하고 label 없이 unseen 데이터를 사용하는 세팅을 transductive 세팅이라 한다.
저자들은 inductive 세팅을 따른다.
저자들은 학습 데이터 $\mathcal{D}_{s}$를 $\left\{x_{i}^{s}, a_{i}^{s}, y_{i}^{s}\right\}_{i=1}^{N_{s}}$라고 정의 한다.
각각 데이터, semantic representation, label 순이다.
이때 inductive 세팅에서 unseen class에 대한 semantic representation을 사용 가능하다.
2. Discriminative approach for ZSC
저자들의 접근법은 unseen class에 대한 인공 데이터를 생성하는 것이다.
그다음 일반적인 classification 접근법으로 classifier를 학습한다.
unseen class 데이터를 사용할 수 있으면 2가지 장점이 생긴다.
1. Generalized Zero Shot Classification을 일반적인 supervised classification problem으로 다룰 수 있다. (GZSL은 예측 단계에서 seen, unseen을 동시에 예측하는 task다)
2. 잠재적으로 수많은 unseen class를 다룰 수 있다.
따라서 gengerator는 unseen data $\widehat{\mathcal{D}}_{u} = \left\{\hat{x}_{i}^{u}, a_{i}^{u}, y_{i}^{u}\right\}_{i=1}^{N_{u}}$를 구축한다.
3. Generating unseen data
Generative Moment Matching Network
Conditional Generative adversarial models
Denoising Auto-Encoder
Adversarial Auto-Encoder
4. Implementing the generators
Experiments
Conclusions
- 공유 링크 만들기
- X
- 이메일
- 기타 앱



댓글
댓글 쓰기