컴퓨터시스템응용기술사 131회 4교시 1번

시험일: 2023-08-28

강화학습(Reinforcement Learning)은 최적의 행동정책을 찾아가는 기계학습 방법이다. 이와 관련하여 다음을 설명하시오. 가. 가치기반 강화학습, 정책기반 강화학습, 액터 크리틱(Actor-Critic) 강화학습 나. 정책경사(Policy Gradient) 방식 강화학습

댓글 (0)

댓글을 작성하려면 로그인이 필요합니다.

아직 댓글이 없습니다. 첫 번째 댓글을 작성해보세요!