HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

EvoCUA：通过从可扩展的合成经验中学习来演化计算机使用代理

EvoCUA：通过从可扩展的合成经验中学习来演化计算机使用代理

Taofeng Xue, Chong Peng, Mianqiu Huang, et al.

HY-MT1.5 技术报告

HY-MT1.5 技术报告

Mao Zheng, Zheng Li, Tao Chen, et al.

代码的缩放定律：每种编程语言都至关重要

代码的缩放定律：每种编程语言都至关重要

Jian Yang, Shawn Guo, Lin Jing, et al.

Qwen3_TTS 技术报告

Qwen3_TTS 技术报告

音频和语音处理

Hangrui Hu, Xinfa Zhu, Ting He, et al.

小模型，大成果：通过分解实现卓越的意图抽取

小模型，大成果：通过分解实现卓越的意图抽取

Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.

LightOnOCR：一种10亿参数的端到端多语言视觉-语言模型，实现最先进的OCR性能

LightOnOCR：一种10亿参数的端到端多语言视觉-语言模型，实现最先进的OCR性能

Said Taghadouini, Adrien Cavaillès, Baptiste Aubertin

FinVault：面向执行基础环境的金融Agent安全基准测试

FinVault：面向执行基础环境的金融Agent安全基准测试

Zhi Yang, Runguo Li, Qiqi Qiang, et al.

MMDeepResearch-Bench：多模态深度研究Agent基准测试

MMDeepResearch-Bench：多模态深度研究Agent基准测试

Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.

DARC：面向LLM演化的解耦非对称推理课程

DARC：面向LLM演化的解耦非对称推理课程

Shengda Fan, Xuyan Ye, Yankai Lin

面向具身世界的视频生成模型再思考

面向具身世界的视频生成模型再思考

Yufan Deng, Zilin Pan, Hongyu Zhang, et al.

Paper2Rebuttal：一种用于透明化作者回复辅助的多智能体框架

Paper2Rebuttal：一种用于透明化作者回复辅助的多智能体框架

检索增强生成

Qianli Ma, Chang Guo, Zhiheng Tian, et al.

LLM的智能体推理

LLM的智能体推理

Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.

PERSONAPLEX：用于全双工对话语音模型的语音与角色控制

PERSONAPLEX：用于全双工对话语音模型的语音与角色控制

音频和语音处理

Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.

FlashLabs Chroma 1.0：具备个性化语音克隆能力的实时端到端语音对话模型

FlashLabs Chroma 1.0：具备个性化语音克隆能力的实时端到端语音对话模型

Tanyu Chen, Tairan Chen, Kai Shen, et al.

MemoryRewardBench：面向大型语言模型长期记忆管理的奖励模型基准测试

MemoryRewardBench：面向大型语言模型长期记忆管理的奖励模型基准测试

Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.

OmniTransfer：面向时空视频迁移的统一框架

OmniTransfer：面向时空视频迁移的统一框架

Pengze Zhang, Yanze Wu, Mengtian Li, et al.

面向高效智能体：记忆、工具学习与规划

面向高效智能体：记忆、工具学习与规划

Xiaofang Yang, Lijun Li, Heng Zhou, et al.

FutureOmni：基于多模态上下文的未来预测评估方法在多模态LLM中的应用

FutureOmni：基于多模态上下文的未来预测评估方法在多模态LLM中的应用

统一多模态

Qian Chen, Jinlan Fu, Changsong Li, et al.

Being-H0.5：面向跨体感泛化的以人为本机器人学习扩展

Being-H0.5：面向跨体感泛化的以人为本机器人学习扩展

机器人技术

Hao Luo, Ye Wang, Wanpeng Zhang, et al.

基于LLM的软件工程问题求解进展与前沿：一项综合调查

基于LLM的软件工程问题求解进展与前沿：一项综合调查

Caihua Li, Lianghong Guo, Yanlin Wang, et al.

Nemotron-Math：基于多模态监督的数学推理高效长上下文蒸馏

Nemotron-Math：基于多模态监督的数学推理高效长上下文蒸馏

Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.

为Gemini构建可投入生产的探测器

为Gemini构建可投入生产的探测器

János Kramár, Joshua Engels, Zheng Wang, et al.

LFM2 技术报告

LFM2 技术报告

检索增强生成

Alexander Amini, Anna Banaszak, Harold Benoit, et al.

CoDance：一种用于鲁棒多主体动画的解绑-重绑范式

CoDance：一种用于鲁棒多主体动画的解绑-重绑范式

Shuai Tan, Biao Gong, Ke Ma, et al.

助手轴：语言模型默认人格的定位与稳定化

助手轴：语言模型默认人格的定位与稳定化

监督式微调

Christina Lu, Jack Gallagher, Jonathan Michala, et al.

ABC-Bench：面向真实世界开发中的智能体后端编码基准测试

ABC-Bench：面向真实世界开发中的智能体后端编码基准测试

Jie Yang, Honglin Guo, Li Ji, et al.

多路思维：通过逐token分支与合并进行推理

多路思维：通过逐token分支与合并进行推理

Yao Tang, Li Dong, Yaru Hao, et al.

推理模型催生“思想百家”

推理模型催生“思想百家”

Junsol Kim, Shiyang Lai, Nino Scherrer, et al.

大规模多Agent AI系统发展与问题研究

大规模多Agent AI系统发展与问题研究

Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.

ACoT-VLA：面向视觉-语言-动作模型的动作思维链

ACoT-VLA：面向视觉-语言-动作模型的动作思维链

机器人技术

Linqing Zhong, Yi Liu, Yifei Wei, et al.

个性化误导之困：理解并缓解个性化LLM中的幻觉问题

个性化误导之困：理解并缓解个性化LLM中的幻觉问题

Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

EvoCUA：通过从可扩展的合成经验中学习来演化计算机使用代理

EvoCUA：通过从可扩展的合成经验中学习来演化计算机使用代理

Taofeng Xue, Chong Peng, Mianqiu Huang, et al.

HY-MT1.5 技术报告

HY-MT1.5 技术报告

Mao Zheng, Zheng Li, Tao Chen, et al.

代码的缩放定律：每种编程语言都至关重要

代码的缩放定律：每种编程语言都至关重要

Jian Yang, Shawn Guo, Lin Jing, et al.

Qwen3_TTS 技术报告

Qwen3_TTS 技术报告

音频和语音处理

Hangrui Hu, Xinfa Zhu, Ting He, et al.

小模型，大成果：通过分解实现卓越的意图抽取

小模型，大成果：通过分解实现卓越的意图抽取

Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.

LightOnOCR：一种10亿参数的端到端多语言视觉-语言模型，实现最先进的OCR性能

LightOnOCR：一种10亿参数的端到端多语言视觉-语言模型，实现最先进的OCR性能

Said Taghadouini, Adrien Cavaillès, Baptiste Aubertin

FinVault：面向执行基础环境的金融Agent安全基准测试

FinVault：面向执行基础环境的金融Agent安全基准测试

Zhi Yang, Runguo Li, Qiqi Qiang, et al.

MMDeepResearch-Bench：多模态深度研究Agent基准测试

MMDeepResearch-Bench：多模态深度研究Agent基准测试

Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.

DARC：面向LLM演化的解耦非对称推理课程

DARC：面向LLM演化的解耦非对称推理课程

Shengda Fan, Xuyan Ye, Yankai Lin

面向具身世界的视频生成模型再思考

面向具身世界的视频生成模型再思考

Yufan Deng, Zilin Pan, Hongyu Zhang, et al.

Paper2Rebuttal：一种用于透明化作者回复辅助的多智能体框架

Paper2Rebuttal：一种用于透明化作者回复辅助的多智能体框架

检索增强生成

Qianli Ma, Chang Guo, Zhiheng Tian, et al.

LLM的智能体推理

LLM的智能体推理

Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.

PERSONAPLEX：用于全双工对话语音模型的语音与角色控制

PERSONAPLEX：用于全双工对话语音模型的语音与角色控制

音频和语音处理

Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.

FlashLabs Chroma 1.0：具备个性化语音克隆能力的实时端到端语音对话模型

FlashLabs Chroma 1.0：具备个性化语音克隆能力的实时端到端语音对话模型

Tanyu Chen, Tairan Chen, Kai Shen, et al.

MemoryRewardBench：面向大型语言模型长期记忆管理的奖励模型基准测试

MemoryRewardBench：面向大型语言模型长期记忆管理的奖励模型基准测试

Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.

OmniTransfer：面向时空视频迁移的统一框架

OmniTransfer：面向时空视频迁移的统一框架

Pengze Zhang, Yanze Wu, Mengtian Li, et al.

面向高效智能体：记忆、工具学习与规划

面向高效智能体：记忆、工具学习与规划

Xiaofang Yang, Lijun Li, Heng Zhou, et al.

FutureOmni：基于多模态上下文的未来预测评估方法在多模态LLM中的应用

FutureOmni：基于多模态上下文的未来预测评估方法在多模态LLM中的应用

统一多模态

Qian Chen, Jinlan Fu, Changsong Li, et al.

Being-H0.5：面向跨体感泛化的以人为本机器人学习扩展

Being-H0.5：面向跨体感泛化的以人为本机器人学习扩展

机器人技术

Hao Luo, Ye Wang, Wanpeng Zhang, et al.

基于LLM的软件工程问题求解进展与前沿：一项综合调查

基于LLM的软件工程问题求解进展与前沿：一项综合调查

Caihua Li, Lianghong Guo, Yanlin Wang, et al.

Nemotron-Math：基于多模态监督的数学推理高效长上下文蒸馏

Nemotron-Math：基于多模态监督的数学推理高效长上下文蒸馏

Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.

为Gemini构建可投入生产的探测器

为Gemini构建可投入生产的探测器

János Kramár, Joshua Engels, Zheng Wang, et al.

LFM2 技术报告

LFM2 技术报告

检索增强生成

Alexander Amini, Anna Banaszak, Harold Benoit, et al.

CoDance：一种用于鲁棒多主体动画的解绑-重绑范式

CoDance：一种用于鲁棒多主体动画的解绑-重绑范式

Shuai Tan, Biao Gong, Ke Ma, et al.

助手轴：语言模型默认人格的定位与稳定化

助手轴：语言模型默认人格的定位与稳定化

监督式微调

Christina Lu, Jack Gallagher, Jonathan Michala, et al.

ABC-Bench：面向真实世界开发中的智能体后端编码基准测试

ABC-Bench：面向真实世界开发中的智能体后端编码基准测试

Jie Yang, Honglin Guo, Li Ji, et al.

多路思维：通过逐token分支与合并进行推理

多路思维：通过逐token分支与合并进行推理

Yao Tang, Li Dong, Yaru Hao, et al.

推理模型催生“思想百家”

推理模型催生“思想百家”

Junsol Kim, Shiyang Lai, Nino Scherrer, et al.

大规模多Agent AI系统发展与问题研究

大规模多Agent AI系统发展与问题研究

Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.

ACoT-VLA：面向视觉-语言-动作模型的动作思维链

ACoT-VLA：面向视觉-语言-动作模型的动作思维链

机器人技术

Linqing Zhong, Yi Liu, Yifei Wei, et al.

个性化误导之困：理解并缓解个性化LLM中的幻觉问题

个性化误导之困：理解并缓解个性化LLM中的幻觉问题

Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.