概要
近期阅读RL的文章和论文什么的,总是会出现TD Error啊,MonteCarlo啊一类的定义,有时候就很影响理解的流畅性。所以在youtube上找了WanShusen老师的视频来学习RL的基础知识。
觉得受益匪浅,所以贴在自己的blog上,同时追加上自己的学习笔记。(其实是因为太多手写公式图片就懒得整理成文章了…)
视频地址:
深度强化学习(1/5):基本概念 Deep Reinforcement Learning (1/5)
深度强化学习(2/5):价值学习 Value-Based Reinforcement Learning
深度强化学习(3/5):策略学习 Policy-Based Reinforcement Learning
深度强化学习(4/5):Actor-Critic Methods
深度强化学习(5/5):AlphaGo & Model-Based RL
学习笔记:
Probability_Density_Function(PDF)概率密度函数.pdf
Temporal_Difference_Learning时间差分学习.pdf
Deep Reinforcement Learning基本概念
Value_Based_Reinforcement_Learning价值学习
Policy_Based_Reinforcement_Learning策略学习
Actor-Critic