본문 바로가기

Markov property1

RL (강화학습) 기초 - 3. Markov Decision Processes (1) 1. Markov Processes 이번에 다루게 될 MDP에 대해서 소개를 하면 RL, 강화학습에서 가장 중요한 핵심 이론이 됩니다. 이 강의에서는 전제조건으로 agent가 환경에서 발생되는 모든 정보를 볼 수 있다고 가정합니다. (fully observable) 설명을 하기 쉬운 환경이지만 실제로 우리가 살고 있는 환경은 그렇치 않죠. 우리는 아무리 노력을 해도 세상의 모든 뉴스를 다 보고 알수는 없기 때문입니다. 어떠한 현재 상태는 큰 프로세스가 진행이 되고 있는 과정 중에서 특정 시점이 될 것이고, 모든 환경을 다 볼 수 있기 때문에 완전히 특성들을 갖추고 있다고 볼 수 있겠습니다. Markov property에 대한 정의를 알아봅니다. agent가 environment에서 어떠한 action을 .. 2017. 8. 8.

이전 1 다음

IT PM Sr. Specialist, 웹/AI증강/블록체인
- 현) (주)모블디 대표
- 전) 성균관대 겸임교수
- 공공장소 법인전환,'21
- 공공블록 오픈,'18
- 저서:대소니의 딥러닝 기초,'18
- sk 계열사 사내 강의,'18
- AI Trading System,'17
- 저서:Jquery Mobile 완벽가이드,'13
- CIGNA Project Award 수상,'13
- (주)라이나 생명보험,'11
- (주)Ace 생명보험,'08

티스토리툴바