[부스트캠프 AI Tech] Recurrent Neural Network / Transformer

중앙백 2022. 2. 13. 20:42

Sequential Model

Naive sequence model : p(xt|xt-1,xt-2,...)
Autoregressive model : p(xt,|xt-1, ... , xt-n) Fix the past timespan
Markov model(first-order autoregressive model) : p(x1,...,xT) = p(xT,|xT-1) p(xT-2|xT-3) ... p(x2|x1)
Latent autoregressive model
출처 : 부스트캠프 AI Tech

Recurrent Neural Network

Short-term dependencies : 멀리있는 정보일수록 영향력이 점차 희미해짐
Vanishing / exploding gradient

Long Short Term Memory (LSTM)

Gated Recurrent Unit

sequential model 문제를 다루기 힘들게 하는 요인

Transformer