最適な行動を選択するように学習するエージェント

エージェント(行動する人や動物やロボット)は報酬信号を使った強化学習によって最適な行動を選択するよう学習する。エージェントは、感覚的観察を用いて環境に関する予測を行う。画像提供:Hanら, 2024年
日付:
2024年6月5日
Copyright OIST (Okinawa Institute of Science and Technology Graduate University, 沖縄科学技術大学院大学). Creative Commons Attribution 4.0 International License (CC BY 4.0).