adversarial attack
はじめに Adversarial Examples Improve Image Recognitionを読んだのでメモ. 端的にはadversarial examplesを頑健性向上などではなく単純なモデルの精度向上に使うというもの. 手法 手法としては,通常のデータ(clean examples)と敵対的データ(adversaria…
はじめに Robustness May Be at Odds with Accuracyを読んだのでメモ. 気持ち この論文ではadversarial robustnessとstandard accuracy(例えば画像分類の精度など)が両立しないことを示し,それはrobust modelとstandard modelが学習によって獲得する特徴表…
はじめに Adversarial Examples Are Not Bugs, They Are Featuresを読んだのでメモ. 気持ち Adversarial Examplesに対する新しい仮説として,Adversarial Examplesはnon-robust featureという説明不可能な特徴量であるという解釈を提案している.このnon-ro…
はじめに Universal adversarial perturbationsを読んだのでメモ. 気持ち 従来のadversarial perturbationsは画像ごとに計算されているのに対し,この論文ではある単一の摂動を用いて画像に関係なくdeep neural networks(DNN)を騙すことが可能かということ…
はじめに EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLESを読んだのでメモ. 気持ち adversarial examplesの存在はneural netの極度の非線形性によって誘発されると仮説が立てられているが,この論文では逆に線形な振る舞いによるものという説を唱えている…
はじめに Intriguing properties of neural networksを読んだのでメモ.Adversarial examplesについて少し勉強してみたいと思い読んでみた. 気持ち Deep neural networks(DNN)における二つの非直感的な振る舞いについて解析した論文.ここでの二つの非直感…
はじめに Feature Denoising for Improving Adversarial Robustnessを読んだのでメモ. 気持ち Figure 1の可視化がモチベーションの全てで,adversarial noiseを加えた画像は元の画像に比べて,CNNの中間的な特徴マップに一種のノイズが含まれる.そのため,…