HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
SOTA
离线强化学习
Offline Rl On D4Rl
Offline Rl On D4Rl
评估指标
Average Reward
评测结果
各个模型在此基准测试上的表现结果
Columns
模型名称
Average Reward
Paper Title
KFC
81.8
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics
ADMPO
81
Any-step Dynamics Model Improves Future Predictions for Online and Offline Reinforcement Learning
Decision Transformer (DT)
73.5
Decision Transformer: Reinforcement Learning via Sequence Modeling
0 of 3 row(s) selected.
Previous
Next
HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
SOTA
离线强化学习
Offline Rl On D4Rl
Offline Rl On D4Rl
评估指标
Average Reward
评测结果
各个模型在此基准测试上的表现结果
Columns
模型名称
Average Reward
Paper Title
KFC
81.8
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics
ADMPO
81
Any-step Dynamics Model Improves Future Predictions for Online and Offline Reinforcement Learning
Decision Transformer (DT)
73.5
Decision Transformer: Reinforcement Learning via Sequence Modeling
0 of 3 row(s) selected.
Previous
Next