HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

虚拟 Agent 经济

虚拟 Agent 经济

Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.

视觉语言模型中视觉定位的理解研究

视觉语言模型中视觉定位的理解研究

多模态表征

Georgios Pantazopoulos, Eda B. Özyiğit

Kling-Avatar：用于级联长时长头像动画合成的多模态指令接地

统一多模态

多模态表征

Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.

机器学习LLM：在数百万个合成表格预测任务上持续预训练语言模型以实现上下文内机器学习

机器学习LLM：在数百万个合成表格预测任务上持续预训练语言模型以实现上下文内机器学习

Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.

EchoX：通过回声训练缓解语音到语音LLM中的声学-语义鸿沟

EchoX：通过回声训练缓解语音到语音LLM中的声学-语义鸿沟

Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.

SimpleVLA-RL：通过强化学习扩展VLA训练

SimpleVLA-RL：通过强化学习扩展VLA训练

监督式微调

Haozhan Li, Yuxin Zuo, Jiale Yu, et al.

VLA-Adapter：一种高效的小规模视觉-语言-动作模型范式

VLA-Adapter：一种高效的小规模视觉-语言-动作模型范式

统一多模态

Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.

scSiameseClu：一种用于解释单细胞RNA测序数据的孪生聚类框架

scSiameseClu：一种用于解释单细胞RNA测序数据的孪生聚类框架

Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.

ST-Raptor：基于LLM的半结构化表格问答

ST-Raptor：基于LLM的半结构化表格问答

Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.

OmniSpatial：面向视觉语言模型的全面空间推理基准

OmniSpatial：面向视觉语言模型的全面空间推理基准

Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.

理解谈判博弈中人类代理与AI代理之间的经济权衡

理解谈判博弈中人类代理与AI代理之间的经济权衡

Crystal Qian, Kehang Zhu, John Horton, et al.

Jupiter：通过Notebook与推理时价值引导搜索增强LLM数据分析能力

Jupiter：通过Notebook与推理时价值引导搜索增强LLM数据分析能力

Shuocheng Li, Yihao Liu, Silin Du, et al.

Hunyuan-MT 技术报告

Hunyuan-MT 技术报告

Mao Zheng, Zheng Li, Bingxin Qu, et al.

P3-SAM：原生3D部件分割

P3-SAM：原生3D部件分割

计算机视觉

Changfeng Ma, Yang Li, Xinhao Yan, et al.

AgentGym-RL：通过多轮强化学习训练LLM Agent实现长时程决策

AgentGym-RL：通过多轮强化学习训练LLM Agent实现长时程决策

Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.

三维与四维世界建模：一项综述

三维与四维世界建模：一项综述

Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.

RewardDance：视觉生成中的奖励缩放

RewardDance：视觉生成中的奖励缩放

Jie Wu, Yu Gao, Zilyu Ye, et al.

分享即关爱：基于集体强化学习经验共享的高效LM后训练

分享即关爱：基于集体强化学习经验共享的高效LM后训练

Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.

FinReflectKG：金融知识图谱的智能体构建与评估

FinReflectKG：金融知识图谱的智能体构建与评估

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.

大规模推理模型的强化学习研究综述

大规模推理模型的强化学习研究综述

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.

F1：一种连接理解与生成到行动的视觉-语言-行动模型

F1：一种连接理解与生成到行动的视觉-语言-行动模型

Qi Lv, Weijie Kong, Hao Li, et al.

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.

重建对齐提升统一多模态模型

重建对齐提升统一多模态模型

Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

Xin Lai, Junyi Li, Wei Li, et al.

多模态大语言模型的视觉表征对齐

多模态大语言模型的视觉表征对齐

多模态表征

Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.

并行-R1：通过强化学习实现并行思维

并行-R1：通过强化学习实现并行思维

监督式微调

Tong Zheng, Hongming Zhang, Wenhao Yu, et al.

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

Longhao Li, Zhao Guo, Hongjie Chen, et al.

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.

自主代码演化邂逅NP-完全性

自主代码演化邂逅NP-完全性

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.

深度研究系统中的强化学习基础：一项综述

深度研究系统中的强化学习基础：一项综述

Wenjun Li, Zhi Chen, Jingru Lin, et al.

工具增强的视觉感知

工具增强的视觉感知

Zetong Zhou, Dongping Chen, Zixian Ma, et al.

虚拟 Agent 经济

虚拟 Agent 经济

Nenad Tomasev, Matija Franklin, Joel Z. Leibo, et al.

视觉语言模型中视觉定位的理解研究

视觉语言模型中视觉定位的理解研究

多模态表征

Georgios Pantazopoulos, Eda B. Özyiğit

Kling-Avatar：用于级联长时长头像动画合成的多模态指令接地

统一多模态

多模态表征

Yikang Ding, Jiwen Liu, Wenyuan Zhang, et al.

机器学习LLM：在数百万个合成表格预测任务上持续预训练语言模型以实现上下文内机器学习

机器学习LLM：在数百万个合成表格预测任务上持续预训练语言模型以实现上下文内机器学习

Haoyu Dong, Pengkun Zhang, Mingzhe Lu, et al.

EchoX：通过回声训练缓解语音到语音LLM中的声学-语义鸿沟

EchoX：通过回声训练缓解语音到语音LLM中的声学-语义鸿沟

Yuhao Zhang, Yuhao Du, Zhanchen Dai, et al.

SimpleVLA-RL：通过强化学习扩展VLA训练

SimpleVLA-RL：通过强化学习扩展VLA训练

监督式微调

Haozhan Li, Yuxin Zuo, Jiale Yu, et al.

VLA-Adapter：一种高效的小规模视觉-语言-动作模型范式

VLA-Adapter：一种高效的小规模视觉-语言-动作模型范式

统一多模态

Yihao Wang, Pengxiang Ding, Lingxiao Li, et al.

scSiameseClu：一种用于解释单细胞RNA测序数据的孪生聚类框架

scSiameseClu：一种用于解释单细胞RNA测序数据的孪生聚类框架

Ping Xu, Zhiyuan Ning, Pengjiang Li, et al.

ST-Raptor：基于LLM的半结构化表格问答

ST-Raptor：基于LLM的半结构化表格问答

Zirui Tang, Boyu Niu, Xuanhe Zhou, et al.

OmniSpatial：面向视觉语言模型的全面空间推理基准

OmniSpatial：面向视觉语言模型的全面空间推理基准

Mengdi Jia, Zekun Qi, Shaochen Zhang, et al.

理解谈判博弈中人类代理与AI代理之间的经济权衡

理解谈判博弈中人类代理与AI代理之间的经济权衡

Crystal Qian, Kehang Zhu, John Horton, et al.

Jupiter：通过Notebook与推理时价值引导搜索增强LLM数据分析能力

Jupiter：通过Notebook与推理时价值引导搜索增强LLM数据分析能力

Shuocheng Li, Yihao Liu, Silin Du, et al.

Hunyuan-MT 技术报告

Hunyuan-MT 技术报告

Mao Zheng, Zheng Li, Bingxin Qu, et al.

P3-SAM：原生3D部件分割

P3-SAM：原生3D部件分割

计算机视觉

Changfeng Ma, Yang Li, Xinhao Yan, et al.

AgentGym-RL：通过多轮强化学习训练LLM Agent实现长时程决策

AgentGym-RL：通过多轮强化学习训练LLM Agent实现长时程决策

Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.

三维与四维世界建模：一项综述

三维与四维世界建模：一项综述

Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.

RewardDance：视觉生成中的奖励缩放

RewardDance：视觉生成中的奖励缩放

Jie Wu, Yu Gao, Zilyu Ye, et al.

分享即关爱：基于集体强化学习经验共享的高效LM后训练

分享即关爱：基于集体强化学习经验共享的高效LM后训练

Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.

FinReflectKG：金融知识图谱的智能体构建与评估

FinReflectKG：金融知识图谱的智能体构建与评估

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.

大规模推理模型的强化学习研究综述

大规模推理模型的强化学习研究综述

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.

F1：一种连接理解与生成到行动的视觉-语言-行动模型

F1：一种连接理解与生成到行动的视觉-语言-行动模型

Qi Lv, Weijie Kong, Hao Li, et al.

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.

重建对齐提升统一多模态模型

重建对齐提升统一多模态模型

Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

Xin Lai, Junyi Li, Wei Li, et al.

多模态大语言模型的视觉表征对齐

多模态大语言模型的视觉表征对齐

多模态表征

Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.

并行-R1：通过强化学习实现并行思维

并行-R1：通过强化学习实现并行思维

监督式微调

Tong Zheng, Hongming Zhang, Wenhao Yu, et al.

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

Longhao Li, Zhao Guo, Hongjie Chen, et al.

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.

自主代码演化邂逅NP-完全性

自主代码演化邂逅NP-完全性

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.

深度研究系统中的强化学习基础：一项综述

深度研究系统中的强化学习基础：一项综述

Wenjun Li, Zhi Chen, Jingru Lin, et al.

工具增强的视觉感知

工具增强的视觉感知

Zetong Zhou, Dongping Chen, Zixian Ma, et al.