심미적 읽기 [795473] · MS 2018 (수정됨) · 쪽지

2025-04-12 03:53:11
조회수 98

수특 독서 221p MDP 이해 못했다면

게시글 주소: https://orbi.kr/00072799123

지문 (가)에서 MDP를 설명하고 있음


아무리 읽어도 이해가 잘 안 됨


그래서 좀 검색해보니 <그림>이 MDP가 아니네?


MDP가 아니라 MRP임 ㅎㅎ


MRP에는 MDP에 있는 정책(policy), 행동(action)이 없음...


^^;




여기에 MDP랑 MRP 정리해서 쓰기엔 지금 새벽이기도 하고 내가 잘 아는 것도 아니고


뭣보다 읽을 사람이 없을듯 ㅎㅎ


호오옥시 궁금하면 아래 참고


https://ralasun.github.io/reinforcement%20learning/2020/07/12/mdp/


지문 마지막 문단에서 '상태 가치'는 v*(s), '행동 가치의 최댓값'은 q*(s, a*)로 읽으면 지문 서술이랑 맞아떨어짐



0 XDK (+0)

  1. 유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.