Giter Club home page Giter Club logo

kias_rl_basics's Introduction

The 9th KIAS CAC Summer School: 강화학습 강의 실습

주제

Dynamic Programming(Value iteration, Policy iteration )

내용

Dynamic programming은 Markov Decision Process(MDP)와 같이 주어진 환경에서 최적의 policy를 계산하기 위해 사용되는 알고리즘 입니다.

강화학습 문제에서 사용하기에 제약이 많지만 이론적으로 굉장히 중요합니다.

그리드월드의 예제로 실습을 통하여 Dynamic programming을 사용하여 최적의 policy를 찾아보고, 강화학습 문제에 적용하기에 제약이 많은 이유를 알아보겠습니다.


주제

Monte Carlo method, Temporal-Difference Learning (Sarsa, Q-learning)

내용

Monte Carlo Method와 Temporal-Difference Learning는 Dynamic programming처럼

환경의 정보를 알고 시작하는 것이 아닌, 경험을 통해 환경과 상호작용을 하며 배웁니다. Episode 끝까지 가야지만 Value를 측정 할 수 있는 Monte Carlo Method와 학습을 하며 Value를 업데이트 하며 배우는 Temporal-Difference Learning의 차이점을 실습을 통하여 알아보겠습니다.


주제

DQN을 이용한 Cartpole 플레이

내용

딥러닝을 강화학습에 연결하면서, 여러가지 문제가 발생하였습니다. Deepmind는 이 문제를 어떠한 방법으로 해결하여 일부 게임에서 사람보다 플레이를 잘하는 에이전트를 만들었는지 알아보겠습니다.


Special thanks to Wonseok Jung & Kyung Mo Kweon

kias_rl_basics's People

Contributors

curt-park avatar wonseokjung avatar

Stargazers

 avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.