Now Loading...

Now Loading...

DQN

DQN

DQNはDeepMind社によって発表されたAIの強化学習のアルゴリズムの一種です。

最初の画像に示したように、スタートをAとし、ゴールをIとした経路を考えます。まず、環境から与えられる設計として物理的にゴールに近くなれば+1,遠くなれば-1,ゴールに到達すると+100であるとし、状態と行動に対応するQテーブルというものを用意します。Qテーブルの初期値は全て0とします。DQNではこのQテーブルを更新し続け、その値が大きい行動がより良いといったように学習を行います。Q値の更新式に則ってQテーブルを更新し続けますが、ここで出てくるγは割引率といい、行動の手数が増えれば増えるほどその行動の価値は低いという情報を加味するための値となります。

クイズ

以下の文章を読み,空欄(ア)に最もよく当てはまる選択肢を1つ選べ. 深層強化学習の1つであるDQN(Deep Q-Network)は、強化学習である(ア)においてQ値を推定するのにディープラーニングを用いたモデルである.
  • 正解を見る
  • 解説を見る
    Q学習はQ値を学習するためのアルゴリズムです。Q値は強化学習において、ある状態においてある行動がどの程度の価値を持つかを指標化したものです。 (参考: G検定公式テキスト 第2版 第6章 6-5 P253) (参考:G検定公式テキスト 第1版 P175)

特別割引クーポンのお知らせ

zero to one G検定 jdla

zero to one G検定 jdla

関連ワード

ディープラーニングの手法

畳み込みニューラルネットワーク

深層生成モデル

画像認識分野

音声処理と自然言語処理分野

深層強化学習分野

モデルの解釈性とその対応

モデルの軽量化