민서네집

[2016-03-21] 의사결정rl : 파트 3 - 1회차 (강화학습기초,딥강화학습,온라인테스팅,의사결정심리) 본문

세미나

[2016-03-21] 의사결정rl : 파트 3 - 1회차 (강화학습기초,딥강화학습,온라인테스팅,의사결정심리)

브라이언7 2016. 3. 14. 10:51

[2016-03-21] 의사결정rl : 파트 3 - 1회차 (강화학습기초,딥강화학습,온라인테스팅,의사결정심리)


https://www.facebook.com/events/1680903478830376/?active_tab=posts


[참고]

Advanced Topics: Reinforcement Learning

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html


[스터디원 모집] #싸이그래머_싸이지먼트 #의사결정RL, #파트3 파이썬을 이용한 강화학습 기초 + 딥강화학습 + 의사결정의 심리학 + 멀티암드밴디트 알고리즘


* 2주에 한번, 월요일, 저녁 7시 30분 ~ 10시 30분, 강남 근처, 무료(장소대여비를 걷을 수는 있습니다), 3/21 시작.

* 이벤트 링크 - https://www.facebook.com/events/1680903478830376/


은근과 끈기의 의사결정 + 강화학습 스터디가 어느새 파트3로 접어듭니다. 파트3에서 새롭게 시작하는 부분은, 

- (기초) Udacity의 강화학습 기초 강좌, 그리고 

- (중급) 딥러닝과 강화학습이 결합한 딥강화학습입니다. 

- (응용) 온라인테스팅 - 웹 최적화를 위한 멀티암드밴디트 알고리즘

입니다. 특히 유다시티의 강화학습 기초 강좌는, 정말 초심자를 위한 코스입니다. 강화학습이 뭐지? 라고 궁금하신 분들에게 딱 좋은 기회라고 생각합니다(지금 스터디원들이 기초를 다시 해야 하기도 하구요..)


전공자 모임이 아닌, 관심있는 누구나 참여하실 수 있는 열린 스터디입니다. 용기와 끈기만 있으면 재밌게 함께 공부하실 수 있습니다. 스터디 참여를 원하시는 분들은 댓글로 다시거나, 이벤트에 참석을 누르시거나, 스터디 일시에 해당 장소로 바로 찾아오시면 됩니다~


====== 스터디 내용 ======

(새로 시작하는 순서)

1. (시작) 강화학습 기초

* Udacity의 강좌 - Machine Learning: Reinforcement Learning

Conversations on Analyzing Data - https://www.udacity.com/…/machine-learning-reinforcement-le…

* 완전 기초부터

* 파이썬 코드로 팩맨 강화학습 예제 함께 살펴봅니다.


2. (시작) 딥강화학습

* CS 294: Deep Reinforcement Learning, Fall 2015 - http://rll.berkeley.edu/deeprlcourse/

* 딥마인드의 논문들

* 중급


3. (시작) 온라인 테스팅 - MAB

* 웹 사이트 최적화를 위한 밴디트 알고리즘 - http://www.aladin.co.kr/shop/wproduct.aspx?ItemId=59519967

* 강화학습의 하위 응용

* 파이썬 실습 포함


4. (파트2에 이어서) 의사결정의 심리학

* Judgment and Decision Making as a Skill: Learning, Development and Evolution - http://www.amazon.com/Judgment-Decision-Making…/…/1107676525

* 의사결정에 대한 심리학

* 의사결정 전략을 어떻게 학습하는가에 대한 부분을 하고 있습니다.


* (DP) 교재 의사결정심리 - Judgment and Decision Making as a Skill: Learning, Development and Evolution - http://www.amazon.com/Judgment-Decision-Making-Skill-Development/dp/1107676525 * (U-RL) 강화학습 기초 - https://www.udacity.com/course/reinforcement-learning--ud600 * (D-RL) CS 294: Deep Reinforcement Learning, Fall 2015 - http://rll.berkeley.edu/deeprlcourse/ * (MAB) 웹 사이트 최적화를 위한 밴디트 알고리즘 - http://www.aladin.co.kr/shop/wproduct.aspx?ItemId=59519967



Open source, interactive data science and scientific computing across over 40 programming languages.

http://jupyter.org/


주피터(Jupyter, IPython >= 3)의 다중 커널 개념 이해하기 - 파이썬2와 파이썬3 동시에 사용하기

http://blog.nacyot.com/articles/2015-05-08-jupyter-multiple-pythons/



모두를 위한 머신러닝/딥러닝 강의

http://hunkim.github.io/ml/


강화학습 총정리


http://nbviewer.jupyter.org/github/psygrammer/dprl/blob/master/part2/RL/part1_총정리/강화학습_총정리.ipynb


'세미나' 카테고리의 다른 글

#금융공학 #싸이지먼트 #FinAlgML #AiFinance  (0) 2016.04.30
싸이그래머 - 의사결정RL  (0) 2016.04.11
s65 스터디 (2016-02-11 시작)  (0) 2016.02.02
직장내 의사소통 기법  (0) 2015.12.21
2015-10-24 KSUG 세미나  (0) 2015.10.09
Comments