Now Loading...

Now Loading...

R-CNN

R-CNN

R-CNNは2段階モデルの物体検出タスクモデルです。

このモデルではまず Selective Search を用いて物体の特徴を示すであろう矩形領域を複数選定します。

次にこれらの抽出された矩形領域をCNNを用いて特徴量を出力します。この特徴量は出力層の一つ手前の全結合層の値を用います。ここで、CNNに入力する矩形領域を同一サイズにする必要があります。

そこで抽出された矩形領域を変形させ、リサイズを行います。

そして最後に特徴量をサポートベクトルマシン(SVM)を利用してクラス分類を行い、回帰モデルによって矩形領域を出力します。

しかし、このSVMは分類したい種類の数だけ用意する必要があります。この手法は物体候補の領域ごとにCNNを用いるため、処理に時間がかかってしまいます。

クイズ

以下の文章を読み、空欄(ア)に最もよく当てはまる選択肢を1つ選べ。 一般画像認識で用いられる(ア)は、関心領域を切り出した後に領域ごとにCNNを用いて物体認識を行う二段階のモデルであり、処理に時間がかかる。
  • 正解を見る
  • 解説を見る
    R-CNN(Regional CNN)は,画像中の物体の位置と名前(カテゴリ)を予測する物体検出に用いられるモデルです.初めに従来手法を用いて物体がある関心領域を切り出し,各領域それぞれに対してCNNを用いてクラス分類を行います.このように二段階のモデルとなっているため,処理に時間がかかります. (参考: G検定公式テキスト 第2版 第6章 6-3 P222-223) (参考:G検定公式テキスト 第1版 P191)

    👉G検定の受験対策は約1,000問収録の「G検定実践トレーニング」へ

R-CNNの仕組みをわかりやすく解説

R-CNNの仕組みと応用例をPythonコードを用いて具体的にわかりやすく解説した記事を公開中です!

こちら↓からアクセスできます。

👉より体系的に学びたい方は「人工知能基礎」(東京大学松尾豊先生監修)へ

人工知能基礎講座を提供中

人工知能の第一人者である東京大学の松尾豊教授が監修した人工知能基礎講座を受講してみませんか? 人工知能の歴史から自然言語処理、機械学習、深層学習といった最先端のトピックやAIに関わる法律問題まで網羅しているので全てのビジネスパーソン・AIの初学者におすすめです。

サンプル動画

人工知能基礎講座はこちら↓ zero to one G検定 人工知能基礎 jdla

AI初学者・ビジネスパーソン向けのG検定対策講座

G検定受験前にトレーニングしたい方向けの問題集「G検定実践トレーニング」も提供中です。 zero to one E資格 jdla

zero to oneの「E資格」向け認定プログラム

日本ディープラーニング協会の実施するE資格の受験ならzero to oneの「E資格」向け認定プログラム (税込165,000円) をおすすめします。当講座は、東京大学大学院工学系研究科の松尾豊教授と東北大学大学院情報科学研究科の岡谷貴之教授が監修する実践的なプログラムとなっています。 厚生労働省の教育訓練給付制度対象のE資格認定プログラムの中では最安値※となり、実質負担額49,500円~(支給割合70%の場合)で受講可能です。※2023年弊社調べ zero to one E資格 jdla

関連ワード

ディープラーニングの手法

畳み込みニューラルネットワーク

深層生成モデル

画像認識分野

音声処理と自然言語処理分野

深層強化学習分野

モデルの解釈性とその対応

モデルの軽量化