跳转至

引导页:强化学习

由于本人所处研究方向缺乏丰富的公开数据,因此为了分析问题,需要使用必要的模拟手段。其中,Agent-based Simulation是我个人认为比较好用的领域,因此,与CS方向的同志们使用强化手段的目的可能有所不同,我感兴趣的是本身的方法、学习过程中agent的反应,以及学习后agent之间的交互关系演变。简言之,解释agent的学习过程、策略。

这一部分写的东西可能来自:

  • 我个人的研究总结
  • David Silver主讲的Introduction to Reinforcement Learning with David Silver
  • Hado van Hasselt等主讲的Deepmind 2021强化学习课程
  • 根据网站csdiy.wiki的指引找到的,由Sergey Levine主讲的UCB CS285 (深度强化学习)及我个人的学习笔记
  • Sutton, R. S., & Barto, A. G. (2018). Reinforcement learning: An introduction . MIT press.

该书汉译本:《强化学习》(第二版) 电子工业出版社出版

英文原本网站:Sutton & Barto Book: Reinforcement Learning: An Introduction

如果Deepmind, UCB课程笔记中已经出现了相应的内容,则我不会在个人笔记中再单开一页重复介绍。

因此:

  1. 关于传统(非深度)强化学习模型的笔记,请优先查阅 Deepmind RL部分(对应上面第1、2、4项)
  2. 关于深度强化学习模型的笔记,请优先查阅 CS285部分(对应上面第3项)。