본문으로 바로가기

MCLearning's FrontEnd StudyRoom

현재위치 :: HOME BLOG CATEGORY SEARCH ARCHIVE TAGS MEDIA LOCATION GUESTBOOK

네비게이션

    관리자
    • 블로그 이미지
      MCLearning2

      강화학습에서 프론트엔드로 전향하면서 그에 관련된 내용들을 정리할 예정입니다.

      링크추가
    • 글쓰기
    • 환경설정
    • 로그인
    • 로그아웃

    Associative Search 검색 결과

    해당 글 1건

    강화학습 sutton ch2 Multi-armed Bandit] #6

    Associative Search (Contextual Bandits) 지금까지 다루었던 것은 nonassociative tasks, 즉 행동과 상황이 어떤 관련이 있을 필요가 없었다. stationary, nonstationary이던간에 그저 하나의 최고 행동을 하면 그만이였다. 하지만 실제 강화학습 문제는 그리 단순하지 않고 하나 이상의 상황이 존재할 것이다. 상황에 따라 행동을 결정해야 하는, 즉 정책(policy)을 학습시켜야 한다. 예를 들면, 이전에 n-armed bandit task가 플레이할 때마다 보상의 분포가 다 임의로 달라진다면? 왠만해서는 이전 방법으로 풀 수가 없다. 대신, 어떻게 바뀌었는지를 알 수 있게 슬롯 머신의 색깔이 변한다면? 그 슬롯 색깔에 따라 행동을 결정할 수 있을 ..

    Sutton Books/Sutton 노트 2019. 2. 1. 10:40
    • 이전
    • 1
    • 다음

    사이드바

    NOTICE

    • 전체 보기
    MORE+

    CATEGORY

    • 분류 전체보기 (49)
      • Programming (5)
        • Pytorch (3)
        • Algorithms (0)
        • HTML (0)
        • CSS (0)
        • Javascript (1)
        • Vue (0)
        • Nuxt (1)
      • Papers (0)
        • PG (0)
        • DQN (0)
        • Intrinsic Reward (0)
        • Object Detection (0)
      • Sutton Books (33)
        • Sutton 노트 (33)
      • Online Tutorials (5)
        • OpenAI Spinnig Up (5)
      • Project (6)
        • 환경설정 (6)
      • 일상 (0)

    RECENTLY

    • 최근 글
    • 최근 댓글

    최근 글

    최근댓글

    Trackback

    TAG

    • 강화학습
    • continuing task
    • openai
    • importance sampling
    • TRPO
    • episodic task
    • rl
    • Monte Carlo
    • monte carlo control
    • Policy Iteration
    • policy gradient
    • SUMMARY
    • e-greedy
    • Sutton
    • reinforcement Learning
    MORE+
    07-14 03:26
    • 홈으로
    • 방명록
    • 로그인
    • 로그아웃
    • 맨위로
    SKIN BY COPYCATZ COPYRIGHT MCLearning's FrontEnd StudyRoom, ALL RIGHT RESERVED.
    MCLearning's FrontEnd StudyRoom
    블로그 이미지 MCLearning2 님의 블로그
    MENU
      CATEGORY
      • 분류 전체보기 (49)
        • Programming (5)
          • Pytorch (3)
          • Algorithms (0)
          • HTML (0)
          • CSS (0)
          • Javascript (1)
          • Vue (0)
          • Nuxt (1)
        • Papers (0)
          • PG (0)
          • DQN (0)
          • Intrinsic Reward (0)
          • Object Detection (0)
        • Sutton Books (33)
          • Sutton 노트 (33)
        • Online Tutorials (5)
          • OpenAI Spinnig Up (5)
        • Project (6)
          • 환경설정 (6)
        • 일상 (0)
      VISITOR 오늘 / 전체
      • 글쓰기
      • 환경설정
      • 로그인
      • 로그아웃
      • 취소

      검색

      티스토리툴바