Now Loading...

Now Loading...

報酬成型

報酬成型

強化学習において、報酬関数の設計と方策の確認を繰り返して、タスクに応じた適切な報酬関数を設計することを報酬成型といいます。

報酬関数をどのように設定するかでエージェントの学習する方策は全く異なるものになっていきます。

特別割引クーポンのお知らせ

zero to one G検定 jdla

zero to one G検定 jdla

関連ワード

ディープラーニングの手法

畳み込みニューラルネットワーク

深層生成モデル

画像認識分野

音声処理と自然言語処理分野

深層強化学習分野

モデルの解釈性とその対応

モデルの軽量化