Now Loading...

Now Loading...

ε-greedy方策

ε-greedy方策

強化学習において、エージェントは最終的な報酬が最大となるように行動しますが、ε-greedy方策は強化学習の手法の一つであり、確率εでランダムな行動をとり、(1-ε)の確率でその時知っている情報の中で最も最適な行動を選択するというものです。

特別割引クーポンのお知らせ

zero to one G検定 jdla

zero to one G検定 jdla

関連ワード

機械学習の具体的手法