강의 도움말
-
CHAPTER 1 : Markov Decision Processes강의시간01:34:14
-
1. 강화학습 코스 소개
- 작성자
- 업데이트 :
- 2024.09.06
- 좋아요
- 7
- 동영상
- 강의시간10:51
-
2. 벨만 방정식
- 작성자
- 업데이트 :
- 2023.07.15
- 좋아요
- 3
- 동영상
- 강의시간13:50
-
3. 마르코프 체인
- 작성자
- 업데이트 :
- 2021.09.29
- 좋아요
- 4
-
과제) OpenAI Gym
- 작성자
- 업데이트 :
- 2024.05.25
- 좋아요
- 4
-
4. 센서 네트워크
- 작성자
- 업데이트 :
- 2020.08.21
- 좋아요
- 3
- 동영상
- 강의시간11:26
-
5. Google Dopamin
- 작성자
- 업데이트 :
- 2022.09.15
- 좋아요
- 2
- 동영상
- 강의시간58:07
-
-
CHAPTER 2 : Dynamic Programming강의시간01:28:16
-
1. 스포츠 배팅
- 작성자
- 업데이트 :
- 2024.04.10
- 좋아요
- 3
- 동영상
- 강의시간10:38
-
2. 벨만 방정식 더 알아보기
- 작성자
- 업데이트 :
- 2020.03.20
- 좋아요
- 1
- 동영상
- 강의시간06:00
-
3. 동적 계획법
- 작성자
- 업데이트 :
- 2020.03.20
- 좋아요
- 1
- 동영상
- 강의시간10:24
-
과제) 동적 계획법과 강화학습 읽기 과제
- 작성자
- 업데이트 :
- 2020.08.21
- 좋아요
- 4
-
4. 가치 반복 알고리즘과 정책 반복 알고리즘
- 작성자
- 업데이트 :
- 2020.03.24
- 좋아요
- 1
-
퀴즈) 동적 계획법
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
-
5. 아이폰 XS와 공급망
- 작성자
- 업데이트 :
- 2021.12.21
- 좋아요
- 1
- 동영상
- 강의시간11:15
-
6. 캐글 도전하기
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간49:59
-
-
CHAPTER 3 : Monte Carlo Methods강의시간01:37:43
-
1. 최적화
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간11:09
-
2. 탐색과 이용
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간02:16
-
과제) 탐색 vs 이용 그리고 멀티 암드 밴딧(Multi-armed Bandit)
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
-
3. 몬테카를로 코딩 튜토리얼
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간13:13
-
과제) MC 예측 & MC 제어
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
-
과제) 몬테카를로 방법
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
-
4. Q러닝
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간10:50
-
과제) 몬테카를로 방법
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
-
5. 텐서 프로세싱
- 작성자
- 업데이트 :
- 2022.01.23
- 좋아요
- 0
- 동영상
- 강의시간01:00:15
-
-
CHAPTER 4 : Model Free Learning강의시간52:09
-
CHAPTER 5 : RL in Continuous Spaces강의시간28:44
-
CHAPTER 6 : Deep Reinforcement Learning강의시간02:04:14
-
CHAPTER 7 : Policy Based Methods강의시간10:18
-
CHAPTER 8 : Policy Gradient Methods강의시간03:23:13
-
CHAPTER 9 : Actor Critic Methods강의시간02:46:07
-
1. 드론
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간11:40
-
2. 어드밴티지 액터 크리틱
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간11:47
-
과제) 비동기적 어드밴티지 액터 크리틱
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
-
3. 연속적인 동작 액터 크리틱
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간06:07
-
4. 근위 정책 최적화
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간20:22
-
5. PPO
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간01:16:44
-
6. 베이지안 액터 크리틱
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
-
7. 액터 크리틱 방법 스터디 가이드
- 작성자
- 업데이트 :
- 2020.02.21
- 좋아요
- 0
- 동영상
- 강의시간39:27
-
-
CHAPTER 10 : Multi Agent RL강의시간19:26
준비중입니다.