HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
FACTS排行榜:大语言模型事实性综合基准
基准
检索增强生成
Aileen Cheng, Alon Jacovi, Amir Globerson, et al.
Nemotron-Cascade:面向通用推理模型的级联强化学习扩展
强化学习
推理
Boxin Wang, Chankyu Lee, Nayeon Lee, et al.
KlingAvatar 2.0 技术报告
文生视频
视频生成
Kling Team, Jialu Chen, Yikang Ding, et al.
QwenLong-L1.5:长上下文推理与记忆管理的后训练方案
推理
监督式微调
Weizhou Shen, Ziyi Yang, Chenliang Li, et al.
ReFusion:一种具有并行自回归解码的扩散型大语言模型
扩散模型
LLM
Jia-Nan Li, Jian Guan, Wei Wu, et al.
无错误的线性注意力机制:从连续时间动力学中获得的精确解
Transformer
LLM
Jingdi Lei, Di Zhang, Soujanya Poria
AI Agent时代中的记忆
Agent
检索增强生成
Yuyang Hu, Shichun Liu, Yanwei Yue, et al.
LongVie 2:多模态可控超长视频世界模型
视频生成
多模态
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
FirstAidQA:面向低连接性环境的急救与应急响应合成数据集
数据集
监督式微调
Saiyma Sittul Muna, Rezwan Islam Salvi, Mushfiqur Rahman Mushfique, et al.
CUDA-L2:通过强化学习超越cuBLAS的矩阵乘法性能
LLM
高性能计算
Songqiao Su, Xiaofei Sun, Xiaoya Li, et al.
X-VLA:作为可扩展跨具身视觉-语言-动作模型的软提示Transformer
Transformer
机器人技术
Jinliang Zheng, Jianxiong Li, Zhihao Wang, et al.
Nemotron 3 Nano:面向Agent推理的开源、高效混合专家Mamba-Transformer模型
Transformer
监督式微调
NVIDIA
基于追踪的结构:视频生成中的结构保持性运动知识蒸馏
视频生成
扩散模型
Yang Fei, George Stoica, Jingyuan Liu, et al.
基于MetaCanvas的MLLM-Diffusion信息传递探索
扩散模型
图像生成
Han Lin, Xichen Pan, Ziqi Huang, et al.
PersonaLive!用于直播的生动肖像图像动画
扩散模型
图生视频
Zhiyuan Li, Chi-Man Pun, Chen Fang, et al.
V-RGBX:基于内在属性精确控制的视频编辑
视频生成
视频处理
Ye Fang, Tong Wu, Valentin Deschaintre, et al.
SVG-T2I:在无需变分自编码器的情况下扩展文本到图像的潜在扩散模型
文生图
扩散模型
Minglei Shi, Haolin Wang, Borui Zhang, et al.
DentalGPT:激励牙科领域的多模态复杂推理
视觉问答
多模态表征
Zhenyang Cai, Jiaming Zhang, Junjie Zhao, et al.
SSRB:对大规模异构半结构化数据的直接自然语言查询
检索增强生成
自然语言处理
Xin Zhang, Mingxin Li, Yanzhao Zhang, et al.
MUVR:具有多层级视觉对应关系的多模态未剪辑视频检索基准
视觉问答
多模态表征
Yue Feng, Jinwei Hu, Qijia Lu, et al.
在Veo世界模拟器中评估Gemini Robotics策略
视频理解
机器人技术
Coline Devin, Yilun Du, Debidatta Dwibedi, et al.
MotionEdit:面向运动中心图像编辑的基准测试与学习
图生图
视频生成
Yixin Wan, Lei Ke, Wenhao Yu, et al.
通过复杂度增强强化学习实现奥运级几何大语言模型智能体
视觉问答
Agent
Haiteng Zhao, Junhao Shen, Yiming Zhang, et al.
OPV:基于结果的流程验证器,用于高效长链推理验证
LLM
推理
Zijian Wu, Lingkai Kong, Wenwei Zhang, et al.
文本到3D生成中的强化学习:我们准备好了吗?一项渐进式探究
强化学习
3D 生成
Yiwen Tang, Zoey Guo, Kaixin Zhu, et al.
面向奥数级数学问题求解的长时程推理Agent
LLM
推理
Songyang Gao, Yuzhe Gu, Zijian Wu, et al.
T-pro 2.0:一种高效的俄语混合推理LLM与实验平台
LLM
推理
Dmitrii Stoianov, Danil Taranets, Olga Tsymboi, et al.
AutoGLM:用于GUI的自主基础Agent
Agent
LLM
Xiao Liu, Bo Qin, Dongzhu Liang, et al.
OpenGU:图去学习的综合基准
基准
机器学习
Bowen Fan, Yuming Ai, Xunkai Li, et al.
预训练、中段训练与强化学习在推理语言模型中的相互作用
强化学习
LLM
Charlie Zhang, Graham Neubig, Xiang Yue
DeepCode:开放的智能体编码
代码生成
检索增强生成
Zongwei Li, Zhonghang Li, Zirui Guo, et al.
InfiniteVL:融合线性与稀疏注意力机制以实现高效、无限输入的视觉-语言模型
Transformer
统一多模态
Hongyuan Tao, Bencheng Liao, Shaoyu Chen, et al.
1
7
8
9
10
11
12
13
48
FACTS排行榜:大语言模型事实性综合基准
基准
检索增强生成
Aileen Cheng, Alon Jacovi, Amir Globerson, et al.
Nemotron-Cascade:面向通用推理模型的级联强化学习扩展
强化学习
推理
Boxin Wang, Chankyu Lee, Nayeon Lee, et al.
KlingAvatar 2.0 技术报告
文生视频
视频生成
Kling Team, Jialu Chen, Yikang Ding, et al.
QwenLong-L1.5:长上下文推理与记忆管理的后训练方案
推理
监督式微调
Weizhou Shen, Ziyi Yang, Chenliang Li, et al.
ReFusion:一种具有并行自回归解码的扩散型大语言模型
扩散模型
LLM
Jia-Nan Li, Jian Guan, Wei Wu, et al.
无错误的线性注意力机制:从连续时间动力学中获得的精确解
Transformer
LLM
Jingdi Lei, Di Zhang, Soujanya Poria
AI Agent时代中的记忆
Agent
检索增强生成
Yuyang Hu, Shichun Liu, Yanwei Yue, et al.
LongVie 2:多模态可控超长视频世界模型
视频生成
多模态
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
FirstAidQA:面向低连接性环境的急救与应急响应合成数据集
数据集
监督式微调
Saiyma Sittul Muna, Rezwan Islam Salvi, Mushfiqur Rahman Mushfique, et al.
CUDA-L2:通过强化学习超越cuBLAS的矩阵乘法性能
LLM
高性能计算
Songqiao Su, Xiaofei Sun, Xiaoya Li, et al.
X-VLA:作为可扩展跨具身视觉-语言-动作模型的软提示Transformer
Transformer
机器人技术
Jinliang Zheng, Jianxiong Li, Zhihao Wang, et al.
Nemotron 3 Nano:面向Agent推理的开源、高效混合专家Mamba-Transformer模型
Transformer
监督式微调
NVIDIA
基于追踪的结构:视频生成中的结构保持性运动知识蒸馏
视频生成
扩散模型
Yang Fei, George Stoica, Jingyuan Liu, et al.
基于MetaCanvas的MLLM-Diffusion信息传递探索
扩散模型
图像生成
Han Lin, Xichen Pan, Ziqi Huang, et al.
PersonaLive!用于直播的生动肖像图像动画
扩散模型
图生视频
Zhiyuan Li, Chi-Man Pun, Chen Fang, et al.
V-RGBX:基于内在属性精确控制的视频编辑
视频生成
视频处理
Ye Fang, Tong Wu, Valentin Deschaintre, et al.
SVG-T2I:在无需变分自编码器的情况下扩展文本到图像的潜在扩散模型
文生图
扩散模型
Minglei Shi, Haolin Wang, Borui Zhang, et al.
DentalGPT:激励牙科领域的多模态复杂推理
视觉问答
多模态表征
Zhenyang Cai, Jiaming Zhang, Junjie Zhao, et al.
SSRB:对大规模异构半结构化数据的直接自然语言查询
检索增强生成
自然语言处理
Xin Zhang, Mingxin Li, Yanzhao Zhang, et al.
MUVR:具有多层级视觉对应关系的多模态未剪辑视频检索基准
视觉问答
多模态表征
Yue Feng, Jinwei Hu, Qijia Lu, et al.
在Veo世界模拟器中评估Gemini Robotics策略
视频理解
机器人技术
Coline Devin, Yilun Du, Debidatta Dwibedi, et al.
MotionEdit:面向运动中心图像编辑的基准测试与学习
图生图
视频生成
Yixin Wan, Lei Ke, Wenhao Yu, et al.
通过复杂度增强强化学习实现奥运级几何大语言模型智能体
视觉问答
Agent
Haiteng Zhao, Junhao Shen, Yiming Zhang, et al.
OPV:基于结果的流程验证器,用于高效长链推理验证
LLM
推理
Zijian Wu, Lingkai Kong, Wenwei Zhang, et al.
文本到3D生成中的强化学习:我们准备好了吗?一项渐进式探究
强化学习
3D 生成
Yiwen Tang, Zoey Guo, Kaixin Zhu, et al.
面向奥数级数学问题求解的长时程推理Agent
LLM
推理
Songyang Gao, Yuzhe Gu, Zijian Wu, et al.
T-pro 2.0:一种高效的俄语混合推理LLM与实验平台
LLM
推理
Dmitrii Stoianov, Danil Taranets, Olga Tsymboi, et al.
AutoGLM:用于GUI的自主基础Agent
Agent
LLM
Xiao Liu, Bo Qin, Dongzhu Liang, et al.
OpenGU:图去学习的综合基准
基准
机器学习
Bowen Fan, Yuming Ai, Xunkai Li, et al.
预训练、中段训练与强化学习在推理语言模型中的相互作用
强化学习
LLM
Charlie Zhang, Graham Neubig, Xiang Yue
DeepCode:开放的智能体编码
代码生成
检索增强生成
Zongwei Li, Zhonghang Li, Zirui Guo, et al.
InfiniteVL:融合线性与稀疏注意力机制以实现高效、无限输入的视觉-语言模型
Transformer
统一多模态
Hongyuan Tao, Bencheng Liao, Shaoyu Chen, et al.
1
7
8
9
10
11
12
13
48