본문으로 바로가기

MCLearning's FrontEnd StudyRoom

현재위치 :: HOME BLOG CATEGORY SEARCH ARCHIVE TAGS MEDIA LOCATION GUESTBOOK

네비게이션

    관리자
    • 블로그 이미지
      MCLearning2

      강화학습에서 프론트엔드로 전향하면서 그에 관련된 내용들을 정리할 예정입니다.

      링크추가
    • 글쓰기
    • 환경설정
    • 로그인
    • 로그아웃

    value function 검색 결과

    해당 글 1건

    강화학습 Sutton [Ch3 Finite Markov Decision Processes] #5 Policies and Value Functions

    Policies and Value Functions 가치 함수(value function)란 주어진 상태(state) 또는 상태에 따른 행동(action)이 에이전트(agent)에게 있어 얼마나 좋은지 추측(estimate)하는 함수로, 정확하게는 에이전트가 앞으로 얼마나 보상을 받을지 (expected return)를 표현하는 함수이다. 이 보상들은 행동에 의해 받는 것이며, 특정한 방법으로 행동을 결정하는데 이를 정책(policy)라 한다. 어떤 상태가 입력으로 주어지면 행동을 선택할 확률을 반환하는 함수이다. 이를 $\pi$라 표현하며, $t$ 시점일 때 상태 $s$에서 행동 $a$를 할 확률은 $\pi(a|s)$이라할 수 있다. 상태 가치 함수 (state-value function) 어떤 정책 ..

    Sutton Books/Sutton 노트 2019. 2. 8. 17:10
    • 이전
    • 1
    • 다음

    사이드바

    NOTICE

    • 전체 보기
    MORE+

    CATEGORY

    • 분류 전체보기 (49)
      • Programming (5)
        • Pytorch (3)
        • Algorithms (0)
        • HTML (0)
        • CSS (0)
        • Javascript (1)
        • Vue (0)
        • Nuxt (1)
      • Papers (0)
        • PG (0)
        • DQN (0)
        • Intrinsic Reward (0)
        • Object Detection (0)
      • Sutton Books (33)
        • Sutton 노트 (33)
      • Online Tutorials (5)
        • OpenAI Spinnig Up (5)
      • Project (6)
        • 환경설정 (6)
      • 일상 (0)

    RECENTLY

    • 최근 글
    • 최근 댓글

    최근 글

    최근댓글

    Trackback

    TAG

    • Policy Iteration
    • Sutton
    • episodic task
    • rl
    • SUMMARY
    • openai
    • policy gradient
    • e-greedy
    • monte carlo control
    • Monte Carlo
    • TRPO
    • importance sampling
    • continuing task
    • reinforcement Learning
    • 강화학습
    MORE+
    09-02 09:40
    • 홈으로
    • 방명록
    • 로그인
    • 로그아웃
    • 맨위로
    SKIN BY COPYCATZ COPYRIGHT MCLearning's FrontEnd StudyRoom, ALL RIGHT RESERVED.
    MCLearning's FrontEnd StudyRoom
    블로그 이미지 MCLearning2 님의 블로그
    MENU
      CATEGORY
      • 분류 전체보기 (49)
        • Programming (5)
          • Pytorch (3)
          • Algorithms (0)
          • HTML (0)
          • CSS (0)
          • Javascript (1)
          • Vue (0)
          • Nuxt (1)
        • Papers (0)
          • PG (0)
          • DQN (0)
          • Intrinsic Reward (0)
          • Object Detection (0)
        • Sutton Books (33)
          • Sutton 노트 (33)
        • Online Tutorials (5)
          • OpenAI Spinnig Up (5)
        • Project (6)
          • 환경설정 (6)
        • 일상 (0)
      VISITOR 오늘 / 전체
      • 글쓰기
      • 환경설정
      • 로그인
      • 로그아웃
      • 취소

      검색

      티스토리툴바