Command Palette
Search for a command to run...
Volodymyr Mnih; Adrià Puigdomènech Badia; Mehdi Mirza; Alex Graves; Timothy P. Lillicrap; Tim Harley; David Silver; Koray Kavukcuoglu

摘要
我们提出了一种概念上简单且轻量级的深度强化学习框架,该框架利用异步梯度下降来优化深度神经网络控制器。我们介绍了四种标准强化学习算法的异步变体,并展示了并行的行为者-学习者对训练具有稳定作用,使得所有四种方法都能成功地训练神经网络控制器。表现最佳的方法是一种异步变体的演员-评论家(actor-critic)算法,它在Atari游戏领域超越了当前的最先进水平,同时仅使用单个多核CPU而非GPU进行训练,时间缩短了一半。此外,我们还证明了异步演员-评论家算法在广泛的连续运动控制问题以及一项新的任务——使用视觉输入导航随机3D迷宫中也取得了成功。
代码仓库
wtingda/DeepRLBreakout
tf
GitHub 中提及
ShibiHe/Q-Optimality-Tightening
GitHub 中提及
Kaixhin/ACER
pytorch
GitHub 中提及
hulanwin/A3C-DRL
tf
GitHub 中提及
nvlabs/gbrl_sb3
pytorch
GitHub 中提及
miyosuda/async_deep_reinforce
tf
GitHub 中提及
AI-RG/rl-experiments
tf
GitHub 中提及
wxj77/TransferReinforcementLearning
tf
GitHub 中提及
muupan/async-rl
GitHub 中提及
bkhmsi/meta-rl-harlow
pytorch
GitHub 中提及
toni-sm/skrl
jax
amanda-lambda/hack-flappy-bird-drl
pytorch
GitHub 中提及
ofekluis/sonic_project_ss19
GitHub 中提及
dickreuter/neuron_poker
GitHub 中提及
deepsense-ai/Distributed-BA3C
tf
GitHub 中提及
aabbeell/reinforcementLearning.a2c.gym
GitHub 中提及
avillemin/Minecraft-AI
pytorch
GitHub 中提及
marload/deep-rl-tf2
tf
GitHub 中提及
alexmlamb/blocks_rl_gru_setup
pytorch
GitHub 中提及
Kaixhin/NoisyNet-A3C
pytorch
GitHub 中提及
joshiatul/game_playing
GitHub 中提及
Khrylx/PyTorch-RL
pytorch
GitHub 中提及
uvipen/Super-mario-bros-A3C-pytorch
pytorch
GitHub 中提及
mavischer/DRRL
pytorch
GitHub 中提及
gungui98/deeprl-a3c-ai2thor
tf
GitHub 中提及
Nasdin/ReinforcementLearning-AtariGame
pytorch
GitHub 中提及
amanda-lambda/drl-experiments
pytorch
GitHub 中提及
yukezhu/tensorflow-reinforce
tf
GitHub 中提及
chainer/chainerrl
pytorch
GitHub 中提及
JulT1/RL_SS19
tf
GitHub 中提及
Zartris/TD3_continuous_control
pytorch
GitHub 中提及
Jzar/Space-Invaders-DQN
tf
GitHub 中提及
Sheepsody/Batched-Impala-PyTorch
pytorch
GitHub 中提及
ikostrikov/pytorch-rl
pytorch
GitHub 中提及
vladfi1/universe-starter-agent
tf
GitHub 中提及
PaulCharnay/Projet_AIF
GitHub 中提及
ikostrikov/pytorch-a3c
pytorch
GitHub 中提及
tensorlayer/RLzoo
tf
GitHub 中提及
liuyuezhang/pyrl
pytorch
GitHub 中提及
danielpolimac/Ispit_Inteligentni_Agenti
GitHub 中提及
sainijagjit/A3C-Pytorch
pytorch
GitHub 中提及
dsinghnegi/atari_RL_agent
pytorch
GitHub 中提及
brett-daley/fast-dqn
tf
GitHub 中提及
qihongl/demo-advantage-actor-critic
pytorch
GitHub 中提及
4rChon/NL-FuN
tf
GitHub 中提及
lcswillems/torch-ac
pytorch
GitHub 中提及
InSpaceAI/RL-Zoo
tf
GitHub 中提及
khanhptnk/bandit-nmt
pytorch
GitHub 中提及
openai/universe-starter-agent
tf
GitHub 中提及
amaudruz/RL_openaigym
pytorch
GitHub 中提及
bentrevett/pytorch-rl
pytorch
GitHub 中提及
qihongl/dlstm-demo
pytorch
GitHub 中提及
sharan-dce/A3C
tf
GitHub 中提及
NervanaSystems/coach
tf
GitHub 中提及
natsumeS/analysis
GitHub 中提及
traai/async-deep-rl
tf
GitHub 中提及
marload/DeepRL-TensorFlow2
tf
GitHub 中提及
DLR-RM/stable-baselines3
pytorch
cdesilv1/sc2_ai_cdes
tf
GitHub 中提及