Now Loading...

Now Loading...

畳み込み

畳み込み

畳み込みは入力データに対してフィルター(カーネル)を適用することによって特徴マップを出力する手法のことです。

この畳み込み処理はフィルターを画像データに対して一定間隔でスライドさせながら適用します。それぞれの場所ではフィルターと入力画像の対応する要素の積の和を特徴マップへ出力します。

クイズ

以下の文章を読み,空欄(ア)~(イ)の組み合わせに最もよく当てはまる選択肢を1つ選べ. CNNは順伝播型ネットワークの中でも特殊な構造で,(ア)や(イ)と呼ばれる層が複数重なっている.(ア)は入力画像の一部の領域について,特定の特徴を持つか否かを計算できるフィルタを掛け合わせや活性化関数による変換などを行う.(イ) は領域内で最も大きな値を出力したり,領域内の全ての値の平均値を出力したりする.
  • 正解を見る
  • 解説を見る
    畳み込みニューラルネットワーク(CNN)は,畳み込み層とプーリング層という2種類の層を持ちます.畳み込み層では画像から特徴を抽出し,プーリング層では画像サイズを決められたルールに従って小さくします. 下図は、それぞれ畳み込みとmaxプーリングの処理を説明した図です。 フィルタの中の数字をどうするかによって、画像から得られる特徴が変わってきますから、CNNでは、それぞれのフィルタをどういった値にすればいいかを学習していくことになります。 すなわち、フィルタの各値が通常のニューラルネットワークで言うところの重みということになるわけです。 maxプーリングの代わりに、avgプーリングと呼ばれる処理を行うこともありますが、こちらは最大値ではなく平均値を取るものです。いずれにせよ、畳み込みと異なり、プーリングは決まった計算を行うだけなので、学習すべきパラメータは存在しません。 (参考: G検定公式テキスト 第2版 第6章 6-1 P205-207) (参考: G検定公式テキスト 第1版 P158-160)

    👉G検定の受験対策は約1,000問収録の「G検定実践トレーニング」へ

“畳み込み”についてもっと学びたい方へ

コンピュータビジョン分野に大きな進展をもたらしたディープラーニングアルゴリズムである畳み込みニューラルネットワークについてより具体的な説明を知りたい方はこちらの記事もチェック↓

Python と PyTorchによる実装コードもあるのでコードを動かして実践もできます!!

畳み込みニューラルネットワーク(CNN)をわかりやすく基本から実装まで解説

👉より体系的に学びたい方は「人工知能基礎」(東京大学松尾豊先生監修)へ

人工知能基礎講座を提供中

人工知能の第一人者である東京大学の松尾豊教授が監修した人工知能基礎講座を受講してみませんか? 人工知能の歴史から自然言語処理、機械学習、深層学習といった最先端のトピックやAIに関わる法律問題まで網羅しているので全てのビジネスパーソン・AIの初学者におすすめです。

サンプル動画

人工知能基礎講座はこちら↓ zero to one G検定 人工知能基礎 jdla

AI初学者・ビジネスパーソン向けのG検定対策講座

G検定受験前にトレーニングしたい方向けの問題集「G検定実践トレーニング」も提供中です。 zero to one E資格 jdla

zero to oneの「E資格」向け認定プログラム

日本ディープラーニング協会の実施するE資格の受験ならzero to oneの「E資格」向け認定プログラム (税込165,000円) をおすすめします。当講座は、東京大学大学院工学系研究科の松尾豊教授と東北大学大学院情報科学研究科の岡谷貴之教授が監修する実践的なプログラムとなっています。 厚生労働省の教育訓練給付制度対象のE資格認定プログラムの中では最安値※となり、実質負担額49,500円~(支給割合70%の場合)で受講可能です。※2023年弊社調べ zero to one E資格 jdla

関連ワード

ディープラーニングの手法

畳み込みニューラルネットワーク

深層生成モデル

画像認識分野

音声処理と自然言語処理分野

深層強化学習分野

モデルの解釈性とその対応

モデルの軽量化