Now Loading...

Now Loading...

A3C

A3C

A3Cは強化学習のモデルベースの手法です。

ResNetはスキップコネクションを導入したCNNのモデル、Word2vec、LSTMは自然言語処理分野で使われる手法です.

クイズ

2016年にDeepMindから発表された強化学習の手法として、最も適切な選択肢を一つ選べ.
  • 正解を見る
  • 解説を見る
    A3Cとは「Asynchronous Advantage Actor Critic」の略であり、Asynchronousは非同期分散学習、Advantageは数ステップ先を考慮してQ値を更新すること、Actor-Clitic法は行動と状態価値を共に学習することを意味しています。 (参考: G検定公式テキスト 第2版 第4章 4-1 P141) (参考:G検定公式テキスト 第1版 P209)

特別割引クーポンのお知らせ

zero to one G検定 jdla

zero to one G検定 jdla

関連ワード

機械学習の具体的手法