[강화학습] 벨만 방정식, 벨만 최적 방정식 이전 포스팅에서 정책, 가치함수, 벨만 기대 방정식, 행동 가치함수, 큐함수의 벨만 기대 방정식에 대해 알아보았습니다. [강화학습] 정책, 가치함수, 벨만 기대 방정식 [강화학습] 정책, 가치함수, 벨만 기대 방정식 이전 포스팅에서 MDP를 구성하는 상태, 행동, 보상함수, 상태 변환 확률, 할인율에 대해 알아보았습니다. https://deep-learning-challenge.tistory.com/46 [강화학습] 강화학습 기본 개념 정리 강화학습의 기본 deep-learning-challenge.tistory.com [강화학습] 큐함수 - 행동 가치함수 [강화학습] 큐함수 - 행동 가치함수 이전 포스팅에서 정책과 가치함수에 대해 다루었습니다. 여기에서 다루..