TensorFlow の「データ拡張（水増し）」コードレシピを紹介

本記事では、深層学習において重要なテクニックの一つであるデータオーグメンテーション(データ拡張)について解説します。PythonのディープラーニングフレームワークであるTensorFlowを用いた簡単な実装方法についても紹介します。

Contents

データ拡張とは
TensorFlowを用いた実装
まとめ

データ拡張とは

深層学習では非常に多くのデータが必要とされますが、データが少ないときもあります。そんなときにデータを増やすための手段の一つがデータ拡張で、画像データにおいて用いられます。どのようにデータを増やすのかですが、すでに存在する実際のデータに対して少しだけ変化を加えたものをたくさん作ることで、データ数を”水増し”します。しかしただ闇雲に増やせばよいというわけではなく、テストしたときによりよい精度を発揮するためにはどのような変化を加えるかも考慮する必要があります。

今回はデータ拡張でデータに加える変化には具体的にどのようなものがあるのかを解説しつつ、その実装も紹介します。

TensorFlowを用いた実装

まず、データ拡張の実装方法にはあらかじめデータの数自体を増やす「オフライン」の方法と、学習時にミニバッチ毎に変換を加えることで疑似的にデータ数を増やす「オンラインの方法」とがあります。オンラインの方法には実際の画像枚数が増えない分メモリを食わないという利点があります。TensorFlowではオンラインのデータ拡張も行うことができますが、今回は単純に一枚の画像のみに対して処理を行うだけとします。画像は以下のコードを実行して表示されるものを用います。

TensorFlowでデータ拡張を行う方法は主に3つあります。

一つ目はTensorFlowの高レベルAPIであるkerasに含まれるImageDataGeneratorを使用する方法です。二つ目は、こちらもkerasを使いますがkerasの前処理レイヤーを使用する方法です。これらのkerasを用いる手法は使いやすいですが、独自のデータ拡張を定義できないというデメリットもあります。三つ目はkerasを用いず、tensorflowのimageクラスを使用する方法です。この方法ではより細かい処理を定義することができます。

それぞれ、以下の実装の具体例を通して身につけましょう。

Random Flip

Random Flip は、ランダムな確率で画像を反転させる処理です。HorizontalFlipとVerticalFlipの二種類があり、HorizontalFlipは画像を水平方向に反転させ、VerticalFlipは画像を垂直方向に反転させます。

では、Random Flipの処理を実装してみましょう。まずはImageDataGeneratorを用いる方法を試してみます。data_generator = ImageDataGenerator(vertical_flip=True)のようにImageDataGeneratorクラスのオブジェクトを作成し、そのflowメソッドを実行することで処理を行うという形になります。ImageDataGeneratorクラスの引数にvertical_flip=Trueのように変換を定義します。今回はVerticalFlip処理を行うように定義しています。

変換を行う確率を設定できないため、何度か実行しないと処理が行われないかもしれません。Augmented imageが元の画像と変わらないようでしたら、何度か実行してみてください。上下逆さまの画像が表示されるはずです。

なお、画像のデータサイズに気を付ける必要があります。もとの画像サイズは(310, 454, 3)：縦、横、チャンネル数の3次元でしたがImageDataGeneratorで処理するためにはミニバッチサイズの次元も必要なため、最初に(1, 310, 454, 3)とデータサイズを変更しています。また、処理後はイテレータ形式で出力されるため、next関数でデータを取り出してあげる必要があります。

次にkerasの前処理レイヤーを用いる方法で実装してみます。この方法では、Sequential APIでモデルを構築するときのようにtf.keras.Sequentialでkerasの前処理レイヤーをまとめたSequentialモデルを作成し、そこに画像データを通すことで処理を行います。

こちらも処理が行われる確率はランダムのため、元の画像と変わっていないようでしたら何度か実行してみてください。なお、この方法は入力画像データが3次元でも機能します。

最後に、tf.imageを使用する方法で実装してみます。tf.imageクラスのメソッドに画像とシード値を渡すだけと、シンプルです。Random Flipはtf.image.stateless_random_flip_left_rightメソッドで実装できます。渡す画像は3次元でも機能します。

Random Crop

Random Cropは画像のランダムな一部を切り抜く処理を行います。三つの方法の内、ImageDataGeneratorを用いる方法以外でRandom Crop処理を行うことができます。

<keras前処理レイヤーを用いる方法>

tf.keras.layers.RandomCropレイヤーを使用します。引数には切り取り後のサイズを指定します。

<tf.imageの機能を用いる方法>

tf.image.stateless_random_cropを使用します。引数には切り取り後のサイズ、シード値も指定する必要があります。

縦軸、横軸の値を見ると切り取っていることがよくわかります。

Random Contrast, Random Brightness

Random Contrastは画像のコントラストをランダムに変更する処理で、Random Brightnessもその名の通り画像の明るさをランダムに変更する処理です。ImageDataGeneratorを用いる方法ではRandom Brightnessを実装でき、tf.imageの機能を用いる方法ではRandom ContrastとRandom Brightnessのどちらも実装することができます。

<ImageDataGeneratorを用いる方法>

brightness_range(明るさの範囲)を引数に指定することでRandom Brightness処理を適用することができます。