論文はこちらからダウンロード。
概要
R-CNN
を使って、薬用カプセルの表面の欠損を検出しています。カプセルの位置を固定する必要がなく、画像のscaling、translation、rotationなどに対応して検出できます。分類にCNNを使わず特徴量抽出で、最終的な分類はleanear SVMで行います。この手法では、欠損があるかだけではなく、欠損の種類や欠損の位置も識別することができます。
先行研究との比較
近年のカプセルの欠損検出の問題点は以下のようなものがあります。
- 欠損のあるカプセルの特徴量抽出の新しい手法が必要: 画像の処理をして欠損を検出する方法が用いられていたが、画像の前処理に頼っており、簡単に欠損を見逃してしまいます。また処理速度と分類の情報にも問題があります。
- 欠損の種類も検出したいができていない: もし検出することができれば、工場の生産工程の改善できます。
この論文ではこれら問題を解決しています。
技術や手法の特徴
R-CNNを使うが、データ・セットが十分ではないケースが多いので、事前学習として、ImageNetのデータセットを使ってからカプセルで学習します。カプセル位置の移動や反転、画像の拡大・縮小をしてカプセルのデータ・セットを拡張します。
手順は以下の通りです。
- カプセルの画像にanotationをする
- カプセルの一部を抽出する
- 欠損があるか計算する
- networkのチューニングを行う
- 欠損の分類の学習をする
annotationは欠損の種類と、欠損のある部分にbouding boxで行います。selective searchを使って、カプセルの一部を抽出します。
1000のカテゴリーを持つImageNetのデータ・セットを使って、AlexNetのアーキテクチャを使って学習します。全8層で、はじめの5層は畳み込み層、次の2層は全結合層、最後の層はsoftmaxです。inputの画像サイズは227 x 227です。
pre-trainで使っていたImage-Netの1000カテゴリーの分類をランダムに初期化する(カプセルの欠損の種類+背景にカテゴライズする)ように変更しました。
Figure 5のような手順で検出します。
検証方法
overlap rateを計算してチューニングを行いました。
評価は以下の3つパターンで実施。
- 傷
- 汚れ
- 傷と汚れ
傷は、一般的なカプセルの欠損です。カプセルの欠損である可能性の閾値を設定することでFalse positiveの値が減少しました。
汚れも一般的なカプセルの欠損にあたります。
傷と汚れの両方で検出します。
また評価の指標としては以下の3つ。freeは欠損していないデータという意味です。
- Detection accuracy
- Positive False rate
- False Positive rate
Sparsenessを使って背景と欠損を検出しています。
その他
selective searchとは
ピクセルレベルで類似する領域をグルーピングしていくことで候補領域を選出するルゴリズムです。要は似たような特徴を持つ領域を結合していき、1つのオブジェクトとして抽出する訳です。