機械学習とかコンピュータビジョンとか

CVやMLに関する勉強のメモ書き。

Segmentation is All You Needを読んだのでメモ

はじめに

Segmentation is All You Needを読んだのでメモ.あまりちゃんと読んで無いので読み違いしている部分があるかもしれない.

気持ち

Object detectionをする上でbounding boxベースの手法の多くではNMSのような後処理が必要となるが,このような処理は再現率を下げる大きな要因となる.一方で,segmentationを基礎とする方法ではこのような問題は起きないが,instanceベースのsegmentationが必要となり,アノテーションや実装のコストが非常に高いという問題がある.

この論文はsegmentationのアノテーションを用いないかつ,単純な方法で非bounding boxベースな検出モデルを提案するというもの.

おおまかな内容

中身は非常に単純.仮定としてbounding boxのアノテーションが与えられているものとする.ここでは,bounding boxのアノテーションをそのまま利用するのではなく,bounding boxに内接する楕円をsegmentationの教師として用いてモデルを学習することを考える.どのようなデータかは論文の図を見れば一発でわかる.重要なのは楕円の内部と輪郭に別なラベルを付与することで,このことにより物体が重なりあっているかどうかを判別することができる.そのため,推論結果のsegmentationマップからoverlapしている領域を除くことができ,輪郭の情報からinstance毎の検出を行うことが可能となる.

終わりに

ベースラインのfaster R-CNNからそこまで大きな性能向上がない(ただモデルのサイズは8分の1くらい)ので実際どこまで有効に働いているかわからないのがちょっと微妙.論文では楕円のフィッティングがうまくいくようなデータしか載っていないのも少し気になる.一応COCOで実験して良く動いているようなので,実験結果を信じれば問題はない様子.