본문 바로가기

프로그래밍/강화학습 (RL)6

틱택토 강화학습 (Tik-Tak-Toe RL) - [심화 탐구] 2024.07.09 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 7월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 7월 과제]드디어 3월부터 달려온 대장정이 끝나갑니다. 이번 달에는 3월부터 6월까지의 내용을 다 정리하고, 연구의 부족분을 채워보도록 하겠습니다. 문제 인식 저는 어렸을 때부터 게임을 만드는 활동olzl07.tistory.com 저번 7월 과제를 끝으로 더 이상 정융탐 과제를 할 필요는 없지만 저번에 시간이 없었어서 연구를 좀 찝찝하게 끝내기도 했고, (쓸데없이 제가 꼭 분석해보겠다고 해서) 추가적으로 확인해볼 사항들이 좀 있었기에 기존 연구를 좀 수정하고 분석해보는 시간을 가져보았습니다. .. 2024. 8. 12.
틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 7월 과제] 2024.06.01 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 6월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 6월 과제]2024.05.31 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 5월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 5월 과제]2024.04.08 - [프로그래밍/강화학olzl07.tistory.com드디어 3월부터 달려온 대장정이 끝나갑니다. 이번 달에는 3월부터 6월까지의 내용을 다 정리하고, 연구의 부족분을 채워보도록 하겠습니다. 문제 인식 저는 어렸을 때부터 게임을 만드는 활동에.. 2024. 7. 9.
틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 6월 과제] 2024.05.31 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 5월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 5월 과제]2024.04.08 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 4월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 4월 과제]2024.03.28 - [프로그래밍/강화학olzl07.tistory.com저번 달에는 사람 2명이서 틱택토를 플레이 할 수 있도록 하는 환경을 구축해주었습니다. 이번 달에는 앞서 구현했던 환경을 보완하고 수정해준 뒤, 강화학습 알고리즘을 짜보도록 하겠습니다.환경.. 2024. 6. 29.
틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 5월 과제] 2024.04.08 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 4월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 4월 과제]2024.03.28 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 3월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 3월 과제]저번 백준 풀이 과제에 이어olzl07.tistory.com저번 달에는 연구에 필요한 이론적 배경들에 대해 공부해보았습니다. 이번 달에 해야할 일은 크게 2가지가 있습니다. - 연구에 필요한 데이터를 수집하여 정리하고 각 속성에 대해 설명하기- 4월의 배경지식을.. 2024. 5. 31.
틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 4월 과제] 2024.03.28 - [프로그래밍/강화학습 (RL)] - 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 3월 과제] 틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 3월 과제]저번 백준 풀이 과제에 이어 이번에는 정보과학융합탐구 과제로 어떠한 프로젝트 하나를 정하고, 그 프로젝트를 수행해보는 과제가 나왔습니다. 따라서 오늘부터 정융탐 과제도 시작해보도록olzl07.tistory.com이번 글에서는 제가 이 프로젝트를 수행하기 위해 필요한 여러 이론적 배경들에 대해 탐구해볼 것입니다.이론적 배경1. 강화학습 (Reinforcement Learning)강화학습은 이전 글에서 설명했으므로 간략하게만 설명하겠습니다.강화학습은 기계 학습의 한 영역으로, 어떤 환경.. 2024. 4. 13.
틱택토 강화학습 (Tik-Tak-Toe RL) - [정보과학융합탐구 - 3월 과제] 저번 백준 풀이 과제에 이어 이번에는 정보과학융합탐구 과제로 어떠한 프로젝트 하나를 정하고, 그 프로젝트를 수행해보는 과제가 나왔습니다. 따라서 오늘부터 정융탐 과제도 시작해보도록 하겠습니다. 정보와 관련된 주제이면 뭐든 상관없지만, 이왕이면 제가 흥미있어 하는 걸 하는 게 좋을 것 같다는 생각이 들었고, 여러 후보들 중 강화학습을 시도해보기로 하였습니다. 문제 인식 저는 어렸을 때부터 게임을 만드는 활동에 흥미가 있었고, 관심을 가지고 있었습니다. 그래서 실제로 엔트리나 스크래치 등의 프로그래밍 언어를 이용해 게임을 만들어보기도 했는데, 고등학교에 들어와서 AI 학습 방법 중 하나인 강화학습이란 것을 알게 되었고, 게임 AI를 만드는 활동에 큰 흥미를 느끼게 되어 이번 정융탐의 주제로 고르게 되었습니다.. 2024. 3. 28.