データ拡張とは元データを改変してデータを増やす手法であり、データ不足の解決汎化性能、ロバスト性の向上につながります。画像データの拡張の手法の一つとしてガウシアンノイズを付与する手法があります。本記事では、この手法について詳しく解説します。

1. ガウシアンノイズについて

ガウシアンノイズとはガウス分布(正規分布)に従う確率密度をもつノイズです。自然界には様々なノイズがあり、画像を撮影するセンサーや電気信号処理の際にもノイズが混入することがあります。このような実世界のノイズの多くはガウス分布で近似できるため、ガウシアンノイズを人工的に付与した画像で学習することで、より現実的な条件に対応できるロバストなモデルを構築できます。

ノイズが従うガウス分布は以下のような関数で表されます。

$$f(x)=\frac{1}{\sqrt{2 \pi \sigma^2}} \exp \left(-\frac{(x-\mu)^2}{2 \sigma^2}\right)$$
特に \(\sigma=1,\mu = 0\) のガウス分布を標準正規分布といい以下のような関数となります。
$$f(x)=\frac{1}{\sqrt{2 \pi}} \exp \left(-\frac{x^2}{2}\right)$$

3種類の分布を表示してみました。横軸に \(x\) の値、縦軸に確率密度 \(f(x)\) の値を表示しています。 また、青で表されるものが \(\sigma=1,\mu = 0\) の正規分布を表しています。

2. ガウスノイズを画像に加えてみる

では実際に画像にガウシアンノイズを加えるとどのようになるのかを試してみましょう。標準偏差(σ)と平均値(μ)を様々に変更して実験を行いました。

標準偏差(σ)の影響:標準偏差を大きくすると、砂嵐のようなノイズがより強く現れることが確認できます。これは、ノイズの振幅が大きくなるためです。

平均値(μ)の影響平均値を変更すると、画像全体の明度が変化します。正の平均値では明るく、負の平均値では暗くなります。

色の変化について:ガウシアンノイズは各色チャンネル(RGB)に独立して適用されるため、局所的に特定の色が強調される現象が起こります。例えば、青チャンネルに大きな正のノイズ値が加わった部分は青みがかって見えます。これはランダムな現象であり、実行のたびに異なる色が強調される可能性があります。

3. 実装コード

最後に実装のコードを置いておくのでガウシアンノイズの標準偏差や平均値を変えて遊んでみてください。こちらは別画像での実装になっています。

 

まとめ

ガウシアンノイズを用いたデータ拡張は、機械学習モデルの汎化性能を向上させる効果的な手法です。適切なパラメータ設定により、実世界の様々なノイズ条件に対応できるロバストなモデルを構築することができます。ぜひ様々なパラメータで実験し、その効果を確認してみてください。

\ シェア /

E資格スピードパッケージ2023#2修了者合格率100%達成

zero to one E資格 jdla

zero to oneの「E資格」向け認定プログラム

日本ディープラーニング協会の実施するE資格の受験ならzero to oneの「E資格」向け認定プログラム (税込165,000円) をおすすめします。当講座は、東京大学大学院工学系研究科の松尾豊教授と東北大学大学院情報科学研究科の岡谷貴之教授が監修する実践的なプログラムとなっています。
厚生労働省の教育訓練給付制度対象のE資格認定プログラムの中では最安値※となり、実質負担額49,500円~(支給割合70%の場合)で受講可能です。※2023年弊社調べ zero to one E資格 jdla

人工知能基礎講座を提供中

人工知能の第一人者である東京大学の松尾豊教授が監修した人工知能基礎講座を受講してみませんか? 人工知能の歴史から自然言語処理、機械学習、深層学習といった最先端のトピックやAIに関わる法律問題まで網羅しているので全てのビジネスパーソン・AIの初学者におすすめです。

サンプル動画

人工知能基礎講座はこちら↓ zero to one G検定 人工知能基礎 jdla

AI初学者・ビジネスパーソン向けのG検定対策講座

G検定受験前にトレーニングしたい方向けの問題集「G検定実践トレーニング」も提供中です。 zero to one E資格 jdla