OpenAI Spinning Up 번역] Part 3: 정책 최적화 소개(Intro to Policy Optimization) Welcome to Spinning Up in Deep RL! 원본은 Part 3: Intro to Policy Optimization OpenAI Spinning Up 번역] Part 1: 강화학습 핵심 개념(Key Concepts in RL) OpenAI Spinning Up 번역] Part 2: 강화학습 알고리즘 종류(Kinds of RL Algorithms) OpenAI Spinning Up 번역] Part 3: 정책 최적화 소개(Intro to Policy Optimization) Table of Contents Part 3: Intro to Policy Optimization Deriving the Simplest Policy Gradient Implementing the Simplest Po.. Online Tutorials/OpenAI Spinnig Up 6년 전
OpenAI Spinning Up 번역] Part 2: 강화학습 알고리즘 종류 Welcome to Spinning Up in Deep RL! 원본은 Part 2: Kinds of RL Algorithms OpenAI Spinning Up 번역] Part 1: 강화학습 핵심 개념(Key Concepts in RL) OpenAI Spinning Up 번역] Part 2: 강화학습 알고리즘 종류(Kinds of RL Algorithms) OpenAI Spinning Up 번역] Part 3: 정책 최적화 소개(Intro to Policy Optimization) Table of Contents Part 2: Kinds of RL Algorithms A Taxonomy of RL Algorithms Links to Algorithms in Taxonomy 이제까지 강화학습 용어와 표기법에.. Online Tutorials/OpenAI Spinnig Up 6년 전
OpenAI Spinning Up 번역] Part 1: 강화학습 핵심 개념(Key Concepts in RL) Welcome to Spinning Up in Deep RL! OpenAI Spinning UP에서 강화학습을 소개하는 부분이 있었다. 오 이거 정리해두면 좋겠는데?(불행의 시작)라는 마음으로 해석에 도전했다. 강화학습 쪽 영어는 그래도 알아들을 거라 생각해서 였는데 생각보다 고통스러운 발번역의 나날...그래도 나름 최선을 다했어 난! 원본은 Part 1: Key Concepts in RL OpenAI Spinning Up 번역] Part 1: 강화학습 핵심 개념(Key Concepts in RL) OpenAI Spinning Up 번역] Part 2: 강화학습 알고리즘 종류(Kinds of RL Algorithms) OpenAI Spinning Up 번역] Part 3: 정책 최적화 소개(Intro t.. Online Tutorials/OpenAI Spinnig Up 6년 전
강화학습 gym atari 환경 설정 Windows에서 Atari 돌리고 싶어서.. 이슈카님의 블로그를 따라하려고 했었는데 여러가지 문제를 많이 겪었다. 그런데 Windows 상에서 MSYS/Cygwin이나 CMake 이나 Zlib이 전혀 필요없도록 누군가 만들어준 분이 있다. 오버플로에서 찾았다. 정말 감사합니다. pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py 다음 코드를 통해 가볍게 테스트 해볼 수 있다. import gym env = gym.make('SpaceInvaders-v0') env.reset() for _ in range(1000): env.step(env.action_space.sample()) env.render.. Project/환경설정 7년 전