引导页:强化学习
由于本人所处研究方向缺乏丰富的公开数据,因此为了分析问题,需要使用必要的模拟手段。其中,Agent-based Simulation是我个人认为比较好用的领域,因此,与CS方向的同志们使用强化手段的目的可能有所不同,我感兴趣的是本身的方法、学习过程中agent的反应,以及学习后agent之间的交互关系演变。简言之,解释agent的学习过程、策略。
这一部分写的东西可能来自:
- 我个人的研究总结
- David Silver主讲的Introduction to Reinforcement Learning with David Silver
- Hado van Hasselt等主讲的Deepmind 2021强化学习课程
- 根据网站csdiy.wiki的指引找到的,由Sergey Levine主讲的UCB CS285 (深度强化学习)及我个人的学习笔记
- Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction . MIT press.
该书汉译本:《强化学习》(第二版) 电子工业出版社出版
英文原本网站:Sutton & Barto Book: Reinforcement Learning: An Introduction
如果Deepmind, UCB课程笔记中已经出现了相应的内容,则我不会在个人笔记中再单开一页重复介绍。
因此:
- 关于传统(非深度)强化学习模型的笔记,请优先查阅
Deepmind RL
部分(对应上面第1、2、4项) - 关于深度强化学习模型的笔记,请优先查阅
CS285
部分(对应上面第3项)。