놀땐 놀고 할 땐 하는 어른이 •͈ᴗ•͈
[RL] 간단하게 정리한 On-policy, Off-policy, Online, Offline Reinforcement Learning