Abstract

GAN은 내부에 두 개의 모델이 존재합니다. → 생성자 모델(G), 검증자 모델(D)

기존 모델들(AutoEncoder, 변분 오토 인코더, 볼츠만 머신)은 주로 확률적인 방법이나 변분 추론을 활용합니다.

이와 다르게 GAN은 두 개의 신경망을 적대적 관계로 설정하여 학습을 진행합니다.

학습하는 과정에 대해서 간략하게 살펴보고 가자.

  1. G가 랜덤한 노이즈를 입력받아서 가짜 데이터를 생성합니다.
  2. D는 실제 데이터와 G가 생성한 데이터를 구분한다.
  3. G는 D가 데이터를 잘못된 판단을 내리도록 학습합니다.

위의 과정을 반복하여 G가 실제 데이터와 유사한 샘플을 생성할 수 있도록 개선합니다.

G와 D가 신경망으로 구성되어있으면 역전파를 통해서 학습을 할 수 있습니다.

→ 기존의 신경망에서 사용했던 마코프 체인이나 근사 추론 네트워크를 사용하지 않습니다.

또한, 단순히 신경망의 순전파를 활용하여 샘플을 생성할 수 있습니다.

1. Introduction

딥러닝의 목표는 다양한 AI 응용 분야에서 확률 분포를 학습할 수 있는 계층적 모델을 구축하는 것입니다.