728x90
반응형
SMALL
[RL] 강화학습 Policy Gradient 수식 전개
·
ML & DL/RL
혁펜하임님의 "혁펜하임의 “트이는” 강화 학습" 을 바탕으로 기록한 내용입니다.  아래 내용은 강의를 보고 policy gradient 내용을 수식으로 쭉 정리한 내용이다.
728x90
반응형
LIST
성장중 •͈ᴗ•͈
'policy gradient' 태그의 글 목록