Now Loading...

Now Loading...

REINFORCE

REINFORCE

REINFORCEは強化学習の一種です。

強化学習のアルゴリズムでは価値関数を最適化するアプローチが基本であるのに対し、REINFORCEは方策を直接見つけ出します。これを方策勾配法といい、REINFORCEは方策勾配法の最も基本的な手法です。

クイズ

方策勾配法は強化学習のアルゴリズムの一つであり、報酬を最大化する方策を勾配法によって求める。方策勾配法の説明として最も適切な選択肢を一つ選べ.
  • 正解を見る
  • 解説を見る
    方策勾配法は報酬の勾配にしたがってより報酬が高くなるように方策パラメータを更新する手法です.その一つにREINFORCEアルゴリズムがあります.他の選択肢は方策勾配法の特徴ではありません.

特別割引クーポンのお知らせ

<人工知能基礎&G検定実践問題集>

・クーポン:aibgt220920-2bso
・有効期間:2022年10月21日(金)

*使い方:以下バナーより「購入する」に進んでいただき、左下のクーポン欄にご記入、適用してください。

zero to one G検定 jdla

<G検定実践トレーニング>

・クーポン:gt220920-1dao
・有効期間:2022年10月21日(金)

*使い方:以下バナーより「購入する」に進んでいただき、左下のクーポン欄にご記入、適用してください。

zero to one G検定 jdla

関連ワード

機械学習の具体的手法