Discrete/Continuous Actions是什么

离散动作和连续动作空间是什么

Intro

强化学习时遇到Discrete Actions和Continuous Actions两个概念不太清楚是什么。以此做个笔记。

什么是Discrete/Continuous Actions

Discrete Actions也就是离散动作可以理解为一个bool型,既当为True时执行此动作,为False时不执行。键盘上的按键和鼠标的左右就是一堆离散动作,只有按下去和没有按下去。 Continuous Actions也就是连续动作可以理解为一个float型,他是一个或多个的实际的数字。 比如鼠标在Unity里的动作,向左为一个正数的float,向右则为一个负数的float。除此之外像是手柄的摇杆和什么东西的坐标也是连续动作。

Licensed under CC BY-NC-SA 4.0
comments powered by Disqus