본문 바로가기

2017/103

ML 뉴스 모음 - 201710 1. 블록체인 기술 [자료 링크] 블록체인에 대한 전반적인 내용의 보고서입니다. 한번 읽어 보면 좋을 내용인 것 같습니다~ [자료 링크] 비트코인에 대한 증권사 리포트입니다. 마이닝에 대한 내용도 상세히 되어 있습니다~ [블로그 링크] 이번에 비트코인이 11월에 하드포크 하는 내용에 대한 블로그입니다~ 2. KAIST AI School [사이트 링크] 양재에서 Kaist 교수님들께서 좋은 주제로 무료 강연을 해주신다고 합니다~ 3. 자바스크립트 채굴기 [사이트 링크] 코인하이브에서 제공하는 모네로 자바스크립트 채굴기를 웹사이트에서 접속자의 CPU 리소스를 이용해서 채굴이 된다고 합니다. 일종의 사이트에 대한 도네이션용으로 생각할 수 있겠네요. 내 자원을 공유해주는거니까요~ [채굴하러가기] 4. 블록체인 .. 2017. 10. 31.
RL (강화학습) 기초 - 6. Monte-Carlo Learning Planning 의 대표적인 Dynamic programming 에서는 MDP를 이미 알고 있는 것을 Bellman 방정식으로 풀어내는 것이였습니다. 그리고 GPI를 따르는 방식으로 최적화 정책을 찾아냈었습니다. Model-free 는 MDP를 모르는 상황에서 환경과 직접적으로 상호작용을 하면서 경험을 통해서 학습을 하게되는 방식을 말합니다. Prediction 은 value를 estimate 하는 것을 말하는데 여기서는 model-free 에서 prediction이므로 MDP를 모르는 상태에서 (환경에 대한 사전지식이 없는 상태에서) 환경과 상호 작용을 하며 value function을 추정해 가는 방식을 말합니다. control 은 이렇게 찾은 value function을 최적화하여 최적의 poilc.. 2017. 10. 29.
RL (강화학습) 기초 - 5. Dynamic Programming 1. Introduce Dynamic 이라는 것은 연속적으로 발생되는 문제들을 푸는 것을 말하고, Programming 은 개발언어가 아니라 수학적인 문제를 의미합니다. Dynamic Programming 이라는 것은 이렇게 연속적으로 스탭 바이 스탭으로 발생되는 문제를 수학적으로 optimising 해서 풀어내는 것이라고 할 수 있습니다. 어떤 문제는 서브 문제들로 쪼개서 분석할 수 있고 이들을 풀어내는 과정에서 해결이 되는데 크게 두가지로 나눠 볼 수 있겠습니다. Dynamic Programming 은 풀어내고자하는 문제를 2가지 특성으로 접근합니다. 하나는 Optimal substructure 로서 최적화를 할 수 있다는 것인데 하나의 문제를 2개 이상의 하위문제로 쪼개고 각각을 최적화하게 되면 원.. 2017. 10. 23.