最適な行動を選択するように学習するエージェント

An agent learns to choose the best course of action

エージェント(行動する人や動物やロボット)は報酬信号を使った強化学習によって最適な行動を選択するよう学習する。エージェントは、感覚的観察を用いて環境に関する予測を行う。画像提供:Hanら, 2024年

日付:
2024年6月5日
シェア: