Command Palette
Search for a command to run...
Ziyu Wang Tom Schaul Matteo Hessel Hado van Hasselt Marc Lanctot Nando de Freitas

摘要
近年来,深度表示在强化学习中的应用取得了许多成功。然而,许多这些应用仍然使用传统的架构,如卷积网络、LSTM(长短期记忆网络)或自编码器。本文中,我们提出了一种新的无模型强化学习神经网络架构。我们的双流网络表示两个独立的估计器:一个用于状态值函数,另一个用于状态依赖的动作优势函数。这种分解的主要好处是在不改变底层强化学习算法的情况下,能够跨动作泛化学习。实验结果表明,该架构在存在大量相似价值动作的情况下,能够实现更好的策略评估。此外,双流架构使我们的强化学习代理在Atari 2600领域超越了现有技术水平。
代码仓库
prajwalgatti/DRL-Continuous-Control
GitHub 中提及
wtingda/DeepRLBreakout
tf
GitHub 中提及
facebookresearch/Horizon
pytorch
GitHub 中提及
nbopardi/smb
tf
GitHub 中提及
shehrum/RL_Navigation
pytorch
GitHub 中提及
alessandrositta/Flatland_challenge
pytorch
GitHub 中提及
R-Sweke/DeepQ-Decoding
tf
GitHub 中提及
gouxiangchen/dueling-DQN-pytorch
pytorch
GitHub 中提及
hemilpanchiwala/Dueling_Network_Architectures
pytorch
GitHub 中提及
dxyang/DQN_pytorch
pytorch
GitHub 中提及
utarumo/RL_implementation
tf
GitHub 中提及
JuliaPOMDP/DeepQLearning.jl
GitHub 中提及
cove9988/TradingGym
GitHub 中提及
iDataist/Navigation-with-Deep-Q-Network
pytorch
GitHub 中提及
170928/-Review-Dueling-Deep-Q-Network
tf
GitHub 中提及
la3lma/chezjulia
tf
GitHub 中提及
guillaumeboniface/bananaland
pytorch
GitHub 中提及
chainer/chainerrl
pytorch
GitHub 中提及
botforge/simplementation
pytorch
GitHub 中提及
jsztompka/DuelDQN
pytorch
GitHub 中提及
near32/regym
pytorch
GitHub 中提及
1jsingh/rl_navigation
pytorch
GitHub 中提及
BY571/DQN-Atari-Agents
pytorch
GitHub 中提及
jezzarax/drlnd_p1_navigation
pytorch
GitHub 中提及
eddynelson/dqn
tf
GitHub 中提及
tensorlayer/RLzoo
tf
GitHub 中提及
fengsterooni/dql
pytorch
GitHub 中提及
rybread1/deep-rl-trex
tf
GitHub 中提及
kshitij-ingale/Reinforcement-Learning
tf
GitHub 中提及
ZainRaza14/deepRL
pytorch
GitHub 中提及
la3lma/Chez
tf
GitHub 中提及
Adrelf/DRL-navigation
pytorch
GitHub 中提及
MEOWMEOW114/nd893-p1-navigation-banana
pytorch
GitHub 中提及
opplieam/Pong-Deep-RL
pytorch
GitHub 中提及
mindspore-courses/Rainbow-MindSpore
mindspore
GitHub 中提及
abryeemessi/Wednesday
GitHub 中提及
kmdanielduan/DQN_Family_PyTorch
pytorch
GitHub 中提及
JBGUIMBAUD/deep-reenforcement-learning
pytorch
GitHub 中提及
xusophia/DataSciFinalProj
pytorch
GitHub 中提及
rybread1/DeepRlTrex
tf
GitHub 中提及
OMS1996/Carla_The_RL_Self-Driving-Car
tf
GitHub 中提及
hemilpanchiwala/Dueling-Network-Architectures
pytorch
GitHub 中提及
ethanmclark1/carla_aebs
pytorch
GitHub 中提及
KDL-umass/saliency_maps
GitHub 中提及
Curt-Park/rainbow-is-all-you-need
GitHub 中提及
nathanin/pad
tf
GitHub 中提及
opendilab/DI-engine
pytorch
mohit8935/Deep-Q-Learning-Paper
pytorch
GitHub 中提及
HussonnoisMaxence/RL_Algorithms
pytorch
GitHub 中提及
NervanaSystems/coach
tf
GitHub 中提及
facebookresearch/ReAgent
pytorch
GitHub 中提及
mightypirate1/DRL-Tetris
tf
GitHub 中提及
austinsilveria/Banana-Collection-DQN
pytorch
GitHub 中提及
shashwatsaxena571/DRL-navigation
pytorch
GitHub 中提及
marload/DeepRL-TensorFlow2
tf
GitHub 中提及
chandar-lab/RLHive
pytorch
philtabor/Deep-Q-Learning-Paper-To-Code
pytorch
GitHub 中提及
atavakol/action-branching-agents
tf
GitHub 中提及
Brandon-Rozek/DeepRL
GitHub 中提及
FaboNo/DRLND
pytorch
GitHub 中提及
SayhoKim/tetrisRL
tf
GitHub 中提及
clarky104/carla_aebs
pytorch
GitHub 中提及
prajwalgatti/DRL-Navigation
GitHub 中提及
ku2482/sac-discrete.pytorch
pytorch
GitHub 中提及
MOVzeroOne/DQN
pytorch
GitHub 中提及