728x90
반응형

혁펜하임님의 "혁펜하임의 “트이는” 강화 학습" 을 바탕으로 기록한 내용입니다. 


 

아래 내용은 강의를 보고 policy gradient 내용을 수식으로 쭉 정리한 내용이다.

 

 

 

728x90
반응형
LIST
성장중 •͈ᴗ•͈