Now Loading...

Now Loading...

畳み込み

畳み込み

畳み込みは入力データに対してフィルター(カーネル)を適用することによって特徴マップを出力する手法のことです。

この畳み込み処理はフィルターを画像データに対して一定間隔でスライドさせながら適用します。それぞれの場所ではフィルターと入力画像の対応する要素の積の和を特徴マップへ出力します。

クイズ

以下の文章を読み,空欄(ア)~(イ)の組み合わせに最もよく当てはまる選択肢を1つ選べ. CNNは順伝播型ネットワークの中でも特殊な構造で,(ア)や(イ)と呼ばれる層が複数重なっている.(ア)は入力画像の一部の領域について,特定の特徴を持つか否かを計算できるフィルタを掛け合わせや活性化関数による変換などを行う.(イ) は領域内で最も大きな値を出力したり,領域内の全ての値の平均値を出力したりする.
  • 正解を見る
  • 解説を見る
    畳み込みニューラルネットワーク(CNN)は,畳み込み層とプーリング層という2種類の層を持ちます.畳み込み層では画像から特徴を抽出し,プーリング層では画像サイズを決められたルールに従って小さくします. 下図は、それぞれ畳み込みとmaxプーリングの処理を説明した図です。 フィルタの中の数字をどうするかによって、画像から得られる特徴が変わってきますから、CNNでは、それぞれのフィルタをどういった値にすればいいかを学習していくことになります。 すなわち、フィルタの各値が通常のニューラルネットワークで言うところの重みということになるわけです。 maxプーリングの代わりに、avgプーリングと呼ばれる処理を行うこともありますが、こちらは最大値ではなく平均値を取るものです。いずれにせよ、畳み込みと異なり、プーリングは決まった計算を行うだけなので、学習すべきパラメータは存在しません。 (参考: G検定公式テキスト 第2版 第6章 6-1 P205-207) (参考: G検定公式テキスト 第1版 P158-160)

人工知能基礎講座を提供中

人工知能の第一人者である東京大学の松尾豊教授が監修した人工知能基礎講座を受講してみませんか? 人工知能の歴史から自然言語処理、機械学習、深層学習といった最先端のトピックやAIに関わる法律問題まで網羅しているので全てのビジネスパーソン・AIの初学者におすすめです。

サンプル動画

人工知能基礎講座はこちら↓ zero to one G検定 人工知能基礎 jdla

AIエンジニアを目指すならE資格

日本ディープラーニング協会の実施するE資格の受験に必要となるE資格認定プログラムを割引価格で提供中です。最短合格を目指す方向けのスピードパッケージを70,000円で提供中。(一発合格で33,000円のキャッシュバックキャンペーンも実施中です) zero to one E資格 jdla

AI初学者・ビジネスパーソン向けのG検定対策講座

G検定受験前にトレーニングしたい方向けの問題集「G検定実践トレーニング」も提供中です。 zero to one E資格 jdla

関連ワード

ディープラーニングの手法

畳み込みニューラルネットワーク

深層生成モデル

画像認識分野

音声処理と自然言語処理分野

深層強化学習分野

モデルの解釈性とその対応

モデルの軽量化