로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

로그인 / 회원가입

난이도

심화

School of AI : MOVE37 강화학습시작하기

커넥트재단

URL복사 밴드 페이스북 트위터

School of AI : MOVE37 강화학습시작하기

School of AI : MOVE37 강화학습시작하기

http://www.boostcourse.org/move37

좋아요 35 수강생 918

하위 메뉴

강의
1. 1. 강화학습 코스 소개
2. 2. 벨만 방정식
3. 3. 마르코프 체인
4. 과제) OpenAI Gym
5. 4. 센서 네트워크
6. 5. Google Dopamin
1. 1. 최적화
2. 2. 탐색과 이용
3. 과제) 탐색 vs 이용 그리고 멀티 암드 밴딧(Multi-armed Bandit)
4. 3. 몬테카를로 코딩 튜토리얼
5. 과제) MC 예측 & MC 제어
6. 과제) 몬테카를로 방법
7. 4. Q러닝
8. 과제) 몬테카를로 방법
9. 5. 텐서 프로세싱
1. 1. 신경과학
2. 과제) Model Based VS Model Free
3. 2. 시간차 학습
4. 3. Q러닝으로 승차 공유 문제 해결하기
5. 4. 양자 컴퓨팅
1. 1. 로봇 조작
2. 2. 랜덤 탐색
3. 3. 칼만 필터
4. 과제) 연속 행동 공간 VS 이산 행동 공간
1. 1. 딥 강화학습 데이터베이스 최적화
2. 2. 딥 Q러닝
3. 4. 듀얼링 DQN - DDQN
4. 5. 신경망 알아보기
5. 과제) PyTorch를 사용한 딥 Q-러닝
1. 1. 메타러닝
2. 2. 정책 검색 알고리즘
3. 3. 진화 알고리즘
4. 과제) Flappy Bird: 인간 vs NEAT vs 다층 퍼셉트론(MLP)
1. 1. 정책 경사 방법 튜토리얼
2. 2. 정책 경사 기법
3. 3. 진화된 경책 경사
4. 4. 정책 경사
5. 과제) 몬테카를로 정책 그래디언트
1. 1. 드론
2. 2. 어드밴티지 액터 크리틱
3. 과제) 비동기적 어드밴티지 액터 크리틱
4. 3. 연속적인 동작 액터 크리틱
5. 4. 근위 정책 최적화
6. 5. PPO
7. 6. 베이지안 액터 크리틱
8. 7. 액터 크리틱 방법 스터디 가이드
1. 1. Move37
2. 2. 역강화학습
3. 3. 알파고 제로
4. 4. 마지막 프로젝트
토론

역순 정렬

제목을 입력하세요.

강의 도움말

CHAPTER 1 : Markov Decision Processes

강의시간01:34:14
CHAPTER 2 : Dynamic Programming

강의시간01:28:16
CHAPTER 3 : Monte Carlo Methods

강의시간01:37:43
CHAPTER 4 : Model Free Learning

강의시간52:09
CHAPTER 5 : RL in Continuous Spaces

강의시간28:44
CHAPTER 6 : Deep Reinforcement Learning

강의시간02:04:14
CHAPTER 7 : Policy Based Methods

강의시간10:18
CHAPTER 8 : Policy Gradient Methods

강의시간03:23:13
CHAPTER 9 : Actor Critic Methods

강의시간02:46:07
CHAPTER 10 : Multi Agent RL

강의시간19:26

준비중입니다.

© NAVER Connect All Rights Reserved.