今天看了个quora说强化学习与监督学习的区别,觉着写的很好,(13) Prasoon Goyal's answer to What is the difference between supervised learning and reinforcement learning? - Quora

大体意思就是强化学习生成的动作会对获取到的数据有影响,但是监督学习不会,所以对于一些场景,很多的状态监督学习的标签是不可能完全覆盖的,但是强化学习的探索机制就可能自己探索到这样的人为不容易打标签的数据。