Asynchronous Advantage Actor Critic
[논문 리뷰] Asynchronous Methods for Deep Reinforcement Learning (A3C)
이번 논문에서는 강화학습을 비동기적이게 학습을 하게 만든 논문을 들고 왔다. 이 논문의 특이점이라고 한다면 보통의 학습에서 쓰이는 GPU를 사용하지 않고 CPU 코어들을 통한 병렬학습을 한다는 것이다. 이를 통해 Atari 벤치마크에서 새로운 기록을 세웠고 다른 도메인에서도 좋은 결과를 보여주는 모습이다. [1602.01783] Asynchronous Methods for Deep Reinforcement Learning (arxiv.org) Asynchronous Methods for Deep Reinforcement Learning We propose a conceptually simple and lightweight framework for deep reinforcement learning that..