CS 294: Deep Reinforcement Learning, Fall 2017

Lecture Review
작성자
관리자
작성일
2020-03-12 10:59
조회
7552


Study 기간: 2018. 7. ~ 2018. 9.

참여 인원: 지도교수 강필성, 박사과정 김준홍, 김창엽, 통합과정 김형석, 김동화, 박민식, 서승완, 손규빈, 박경찬, 석사과정 박재선, 모경현, 정재윤, 장명준, 송서하, 정민성, 최희정, 양우식
일시 Chapter 발표자 발표자료/영상
2018-07-02 1-2. Introduction and course overview & Supervised learning of Behaviors 박경찬 발표자료 ">발표영상
2018-07-09 3. Introduction to reinforcement learning 양우식 발표자료 ">발표영상
2018-07-09 4. Policy gradients 양우식 발표자료 ">발표영상
2018-07-16 5. Actor-critic introduction 손규빈 발표자료 ">발표영상
2018-07-16 6. Value function methods 손규빈 발표자료 ">발표영상
2018-07-23 7. Deep RL with !-functions 최희정 발표자료 ">발표영상
2018-07-23 8. Optimal control and planning 최희정 발표자료 ">발표영상
2018-07-30 9. Model-based reinforcement learning (1) 정민성 발표자료 ">발표영상
2018-07-30 10. Model-based RL and policy learning 정민성 발표자료 ">발표영상
2017-08-06 11. Advanced model learning 박경찬 발표자료 ">발표영상
2017-08-06 12. Connections between inference and control 최희정 발표자료 " target="_blank" rel="noopener">발표영상
2018-08-13 13. Inverse reinforcement learning 손규빈 발표자료 ">발표영상
2018-08-13 14. Advanced policy gradient methods 양우식 발표자료 ">발표영상
2018-08-20 15. Exploration 최희정 발표자료 ">발표영상
2018-08-20 16. Exploration (part 2) and transfer learning 박경찬 발표자료 " target="_blank" rel="noopener">발표영상
2018-08-27 17. Transfer and multi-task learning 양우식 발표자료
2018-08-27 18. Meta-learning 손규빈 발표자료 ">발표영상
2018-09- 19. Advanced imitation learning challenges and open problems 정민성
전체 0

전체 544
번호 제목 작성자 작성일 추천 조회
공지사항
Paper Reviews 2019 Q3
관리자 | 2020.03.12 | 추천 0 | 조회 13861
관리자 2020.03.12 0 13861
공지사항
Paper Reviews 2019 Q2
관리자 | 2020.03.12 | 추천 0 | 조회 12609
관리자 2020.03.12 0 12609
공지사항
Paper Reviews 2019 Q1
관리자 | 2020.03.12 | 추천 0 | 조회 13531
관리자 2020.03.12 0 13531
481
[Paper Review] About DeepSeek: Only the Research, No Hype (12)
Jaewon Cheon | 2025.02.13 | 추천 0 | 조회 1483
Jaewon Cheon 2025.02.13 0 1483
480
[Paper Review] Constructing Enhanced Mutual Information for Online Class-Incremental Learning (11)
Hun Im | 2025.02.11 | 추천 0 | 조회 639
Hun Im 2025.02.11 0 639
479
[Paper Review] TransFusion -- A Transparency-Based Diffusion Model for Anomaly Detection (12)
Woojun Lee | 2025.02.05 | 추천 0 | 조회 1124
Woojun Lee 2025.02.05 0 1124
478
[Paper Review] RecRanker: Instruction Tuning Large Language Model as Ranker for Top-k Recommendation (12)
Doyoon Kim | 2025.01.25 | 추천 0 | 조회 1062
Doyoon Kim 2025.01.25 0 1062
477
[Paper Review] MetaUAS: Universal Anomaly Segmentation with One-Prompt Meta-Learning (13)
Jaehyuk Heo | 2025.01.20 | 추천 0 | 조회 1087
Jaehyuk Heo 2025.01.20 0 1087
476
[Paper Review] Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping (12)
Woongchan Nam | 2025.01.17 | 추천 0 | 조회 1446
Woongchan Nam 2025.01.17 0 1446
475
[Paper Review] MLLM-as-a-Judge: Assessing Multimodal LLM-as-a-Judge with Vision-Language Benchmark (13)
Kiyoon Jeong | 2025.01.16 | 추천 0 | 조회 1440
Kiyoon Jeong 2025.01.16 0 1440
474
[Paper Review] Large Language Models for Time Series Anomaly Detection (12)
Hyeongwon Kang | 2025.01.10 | 추천 0 | 조회 3501
Hyeongwon Kang 2025.01.10 0 3501
473
[PaperReview] TokenRec: Learning to Tokenize ID for LLM-based Generative Recommendations (13)
Jungho Lee | 2025.01.06 | 추천 0 | 조회 1088
Jungho Lee 2025.01.06 0 1088
472
[Paper Review] Training Large Language Models to Reason in a Continuous Latent Space (12)
Jaehee Kim | 2025.01.05 | 추천 0 | 조회 1673
Jaehee Kim 2025.01.05 0 1673

Data Science & Business Analytics Lab.
Department of Industrial Engineering, College of Engineering,
Seoul National University

Contact Us

  • 강필성 교수 (pilsung_kang@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 301호 
  • 대학원 연구실 (총무 김도윤: doyooni303@snu.ac.kr)
    서울특별시 관악구 관악로 1 서울대학교 공과대학 39동 411호