본문 바로가기

마르코프 결정 과정1

틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 4월 과제] 2024.03.28 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 3월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 3월 과제]저번 백준 풀이 과제에 이어 이번에는 정보과학융합탐구 과제로 어떠한 프로젝트 하나를 정하고, 그 프로젝트를 수행해보는 과제가 나왔습니다. 따라서 오늘부터 정융탐 과제도 시작해보도록olzl07.tistory.com이번 글에서는 제가 이 프로젝트를 수행하기 위해 필요한 여러 이론적 배경들에 대해 탐구해볼 것입니다.이론적 배경1. 강화학습 (Reinforcement Learning)강화학습은 이전 글에서 설명했으므로 간략하게만 설명하겠습니다.강화학습은 기계 학습의 한 영역으로, 어떤 환경.. 2024. 4. 13.

이전 1 다음

티스토리툴바