Spherical Latent Spaces for Stable Variational Autoencodersを読んだのでメモ
はじめに
Spherical Latent Spaces for Stable Variational Autoencodersを読んだのでメモ.VAEのKL collapse(latent variable collapse)をpriorに固定のvon Mises-Fisher分布 (vMF) を使う事で回避するというもの.
論文自体は自然言語に寄って書かれていて自分は興味ないので簡潔に
von Mises-Fisher VAE
Von Mises-Fisher分布(vMF)は空間の超球上での分布で方向ベクトルと集中度パラメータを持つ.vMFのPDFは次の様に定義される.
ただし,は第1種ベッセル関数.
priorとしてを使い,変分事後分布としてはを使う.ただし,はencoderの出力,は定数として定める.以上からVAEのevidence lower boundにおけるKL項は次の様になる.
別な論文のAppendixに丁寧な証明があったので導出は省略.この式はのみに依存していて,が定数であることからKL項はfixとなりKL collapseを起こさなくなるという主張.自分の理解が間違ってなければ学習はreconstractionのみで行われるのでその辺りどうなのか.一応を変えた時のKLの値をプロットして簡単な考察をしてたけども.
vMFからのサンプルは,"change magnitude"と呼ばれるをrejection samplingによりサンプリングし,超球上のに接する単位ベクトルをサンプリングすれば,として得ることができる.
まとめ
KL項が固定になるというのがとても気持ち悪い気がするけど実験ではそれなりにうまく行ってるっぽい.