컴퓨터시스템응용기술사 131회 2교시 1번

시험일: 2023-08-28

마르코프 특성(Markov Property)은 미래 상태의 조건부 확률분포가 과거 상태와는 독립적으로 현재 상태에 의해서만 결정된다는 것을 뜻한다. 이와 관련하여 다음을 설명하시오. 가. 마르코프 결정 프로세스(Markov Decision Process)와 전이확률(Transition Probability) 나. 상태가치함수(State Value Function)와 액션가치함수(State-Action Value Function) 다. 벨만기대방정식(Bellman Expectation Equation)과 벨만최적방정식(Bellman Optimality Equation)

댓글 (0)

댓글을 작성하려면 로그인이 필요합니다.

아직 댓글이 없습니다. 첫 번째 댓글을 작성해보세요!