본문으로 바로가기

MCLearning's FrontEnd StudyRoom

현재위치 :: HOME BLOG CATEGORY SEARCH ARCHIVE TAGS MEDIA LOCATION GUESTBOOK

네비게이션

    관리자
    • 블로그 이미지
      MCLearning2

      강화학습에서 프론트엔드로 전향하면서 그에 관련된 내용들을 정리할 예정입니다.

      링크추가
    • 글쓰기
    • 환경설정
    • 로그인
    • 로그아웃

    Asynchronous Dynamic Programming 검색 결과

    해당 글 1건

    강화학습 Sutton [Ch4 Dynamic Programming] #5 Asynchronous Dynamic Programming

    Asynchronous Dynamic Programming DP (Dynamic Programming)의 단점은 MDP의 상태 전부를 가지고 하는 연산이다. 즉, 상태 전체에 걸쳐 sweep을 해야한다는 것. 당연히 상태가 매우 커진다면, 계산량이 엄청 많이 필요해지는 건 당연하다. Asynchronous DP는 이를 좀 더 개선하는 방법 중 하나로, 이전처럼 상태 하나하나 순서대로 sweep하는 것 대신, 동시에 비동기적으로 하는 것이다. 물론 어떤 상태는 이미 여러 번 업데이트 된 것일 수 있고, 한 번도 안한 것일 수도 있으나, 반드시 모든 상태에 대해서 계속 iteration을 한다면 수렴한다. Asynchronous DP는 업데이트할 상태를 선택하는 것에 이썽서 굉장히 유연하다. 예를 들어 po..

    Sutton Books/Sutton 노트 2019. 2. 15. 15:03
    • 이전
    • 1
    • 다음

    사이드바

    NOTICE

    • 전체 보기
    MORE+

    CATEGORY

    • 분류 전체보기 (49)
      • Programming (5)
        • Pytorch (3)
        • Algorithms (0)
        • HTML (0)
        • CSS (0)
        • Javascript (1)
        • Vue (0)
        • Nuxt (1)
      • Papers (0)
        • PG (0)
        • DQN (0)
        • Intrinsic Reward (0)
        • Object Detection (0)
      • Sutton Books (33)
        • Sutton 노트 (33)
      • Online Tutorials (5)
        • OpenAI Spinnig Up (5)
      • Project (6)
        • 환경설정 (6)
      • 일상 (0)

    RECENTLY

    • 최근 글
    • 최근 댓글

    최근 글

    최근댓글

    Trackback

    TAG

    • rl
    • TRPO
    • episodic task
    • Monte Carlo
    • openai
    • SUMMARY
    • importance sampling
    • 강화학습
    • Policy Iteration
    • policy gradient
    • Sutton
    • reinforcement Learning
    • e-greedy
    • monte carlo control
    • continuing task
    MORE+
    08-14 11:00
    • 홈으로
    • 방명록
    • 로그인
    • 로그아웃
    • 맨위로
    SKIN BY COPYCATZ COPYRIGHT MCLearning's FrontEnd StudyRoom, ALL RIGHT RESERVED.
    MCLearning's FrontEnd StudyRoom
    블로그 이미지 MCLearning2 님의 블로그
    MENU
      CATEGORY
      • 분류 전체보기 (49)
        • Programming (5)
          • Pytorch (3)
          • Algorithms (0)
          • HTML (0)
          • CSS (0)
          • Javascript (1)
          • Vue (0)
          • Nuxt (1)
        • Papers (0)
          • PG (0)
          • DQN (0)
          • Intrinsic Reward (0)
          • Object Detection (0)
        • Sutton Books (33)
          • Sutton 노트 (33)
        • Online Tutorials (5)
          • OpenAI Spinnig Up (5)
        • Project (6)
          • 환경설정 (6)
        • 일상 (0)
      VISITOR 오늘 / 전체
      • 글쓰기
      • 환경설정
      • 로그인
      • 로그아웃
      • 취소

      검색

      티스토리툴바