R-CNN

R-CNNは2段階モデルの物体検出タスクモデルです。

このモデルではまず Selective Search を用いて物体の特徴を示すであろう矩形領域を複数選定します。

次にこれらの抽出された矩形領域をCNNを用いて特徴量を出力します。この特徴量は出力層の一つ手前の全結合層の値を用います。ここで、CNNに入力する矩形領域を同一サイズにする必要があります。

そこで抽出された矩形領域を変形させ、リサイズを行います。

そして最後に特徴量をサポートベクトルマシン(SVM)を利用してクラス分類を行い、回帰モデルによって矩形領域を出力します。

しかし、このSVMは分類したい種類の数だけ用意する必要があります。この手法は物体候補の領域ごとにCNNを用いるため、処理に時間がかかってしまいます。

クイズ

以下の文章を読み、空欄（ア）に最もよく当てはまる選択肢を1つ選べ。一般画像認識で用いられる（ア）は、関心領域を切り出した後に領域ごとにCNNを用いて物体認識を行う二段階のモデルであり、処理に時間がかかる。

FCN
U-Net
VGG
R-CNN

正解を見る

解説を見る
R-CNN（Regional CNN）は，画像中の物体の位置と名前（カテゴリ）を予測する物体検出に用いられるモデルです．初めに従来手法を用いて物体がある関心領域を切り出し，各領域それぞれに対してCNNを用いてクラス分類を行います．このように二段階のモデルとなっているため，処理に時間がかかります．（参考: G検定公式テキスト第2版第6章 6-3 P222-223) （参考：G検定公式テキスト第1版 P191）
👉G検定の受験対策は約1,000問収録の「G検定実践トレーニング」へ

R-CNNの仕組みをわかりやすく解説

R-CNNの仕組みと応用例をPythonコードを用いて具体的にわかりやすく解説した記事を公開中です！

こちら↓からアクセスできます。

R-CNNを使った物体検出で驚異的な精度向上！その仕組みと応用例を徹底解説

👉より体系的に学びたい方は「人工知能基礎」（東京大学松尾豊先生監修）へ

人工知能基礎講座を提供中

人工知能の第一人者である東京大学の松尾豊教授が監修した人工知能基礎講座を受講してみませんか？人工知能の歴史から自然言語処理、機械学習、深層学習といった最先端のトピックやAIに関わる法律問題まで網羅しているので全てのビジネスパーソン・AIの初学者におすすめです。

サンプル動画

人工知能基礎講座はこちら↓

AI初学者・ビジネスパーソン向けのG検定対策講座

G検定受験前にトレーニングしたい方向けの問題集「G検定実践トレーニング」も提供中です。

zero to oneの「E資格」向け認定プログラム

日本ディープラーニング協会の実施するE資格の受験ならzero to oneの「E資格」向け認定プログラム (税込165,000円) をおすすめします。当講座は、東京大学大学院工学系研究科の松尾豊教授と東北大学大学院情報科学研究科の岡谷貴之教授が監修する実践的なプログラムとなっています。厚生労働省の教育訓練給付制度対象のE資格認定プログラムの中では最安値※となり、実質負担額49,500円～(支給割合70%の場合)で受講可能です。※2023年弊社調べ

G検定（AI・機械学習）用語集トップ

G検定（AI・機械学習）用語集

R-CNN

R-CNN

R-CNNの仕組みをわかりやすく解説

人工知能基礎講座を提供中

サンプル動画

AI初学者・ビジネスパーソン向けのG検定対策講座

zero to oneの「E資格」向け認定プログラム

関連ワード

畳み込みニューラルネットワーク

深層生成モデル

画像認識分野

音声処理と自然言語処理分野

深層強化学習分野

モデルの解釈性とその対応

モデルの軽量化