HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

预算感知工具使用实现Agent的有效扩展

预算感知工具使用实现Agent的有效扩展

Tengxiao Liu, Zifeng Wang, Jin Miao, et al.

视频内指令：视觉信号作为生成控制

视频内指令：视觉信号作为生成控制

Gongfan Fang, Xinyin Ma, Xinchao Wang

DR Tulu：面向深度研究的基于演化评分标准的强化学习

DR Tulu：面向深度研究的基于演化评分标准的强化学习

Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.

AICC：精细化HTML解析，提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库

AICC：精细化HTML解析，提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库

Ren Ma, Jiantao Qiu, Chao Xu, et al.

UltraFlux：面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计

UltraFlux：面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计

Tian Ye, Song Fei, Lei Zhu

DeCo：面向端到端图像生成的频率解耦像素扩散

DeCo：面向端到端图像生成的频率解耦像素扩散

Zehong Ma, Longhui Wei, Shuai Wang, et al.

计算机操作 Agent 作为生成式用户界面的评判者

计算机操作 Agent 作为生成式用户界面的评判者

Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.

AutoEnv：衡量 Agent 跨环境学习的自动化环境

AutoEnv：衡量 Agent 跨环境学习的自动化环境

Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.

基于深度研究的通用 Agent 记忆

基于深度研究的通用 Agent 记忆

检索增强生成

B. Y. Yan, Chaofan Li, Hongjin Qian, et al.

VIRAL：面向人形机器人运动操作的规模化视觉仿真到现实迁移

VIRAL：面向人形机器人运动操作的规模化视觉仿真到现实迁移

计算机视觉

Tairan He, Zi Wang, Haoru Xue, et al.

MIST：基于监督训练的互信息

MIST：基于监督训练的互信息

German Gritsai, Megan Richards, Maxime Méloux, et al.

多Agent深度研究：基于M-GRPO训练多Agent系统

多Agent深度研究：基于M-GRPO训练多Agent系统

Haoyang Hong, Jiajun Yin, Yuan Wang, et al.

无数据流程图提炼

无数据流程图提炼

Shangyuan Tong, Nanye Ma, Saining Xie, et al.

HunyuanOCR 技术报告

HunyuanOCR 技术报告

Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.

PhysToolBench：面向MLLMs的物理工具理解能力评估

PhysToolBench：面向MLLMs的物理工具理解能力评估

Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.

赫胥黎-哥德尔机器：通过最优自改进机器的近似实现人类水平的编码Agent开发

赫胥黎-哥德尔机器：通过最优自改进机器的近似实现人类水平的编码Agent开发

Wenyi Wang, Piotr Piękos, Li Nanbo, et al.

无需空间超感知的空间超感知求解

无需空间超感知的空间超感知求解

计算机视觉

Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.

Parrot：输出真实性的说服与认同鲁棒性评级——面向 LLMs 的阿谀鲁棒性基准

Parrot：输出真实性的说服与认同鲁棒性评级——面向 LLMs 的阿谀鲁棒性基准

Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli

O-Mem：面向个性化、长跨度及自进化 Agents 的全能记忆系统

O-Mem：面向个性化、长跨度及自进化 Agents 的全能记忆系统

Piaohong Wang, Motong Tian, Jiaxian Li, et al.

揭示文本本征维度：从学术摘要到创意故事

揭示文本本征维度：从学术摘要到创意故事

自然语言处理

Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.

SAM 3：基于概念的万物分割

SAM 3：基于概念的万物分割

计算机视觉

Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.

GeoVista：面向地理定位的网络增强 Agent 视觉推理

GeoVista：面向地理定位的网络增强 Agent 视觉推理

检索增强生成

Yikun Wang, Zuyan Liu, Ziyi Wang, et al.

OpenMMReasoner：以开放与通用的方案拓展多模态推理的前沿

OpenMMReasoner：以开放与通用的方案拓展多模态推理的前沿

监督式微调

Kaichen Zhang, Keming Wu, Zuhao Yang, et al.

HiPO：面向LLMs动态推理的混合策略优化

HiPO：面向LLMs动态推理的混合策略优化

Ken Deng, Zizheng Zhan, Wen Xiang, et al.

SERES：基于语义感知的稀疏视角神经重建

SERES：基于语义感知的稀疏视角神经重建

计算机视觉

Bo Xu, Yuhu Guo, Yuchao Wang, et al.

SDAR：一种用于可扩展序列生成的协同扩散-自回归范式

SDAR：一种用于可扩展序列生成的协同扩散-自回归范式

Shuang Cheng, Yihan Bian, Dawei Liu, et al.

MultiPL-MoE：通过混合专家模型扩展大型语言模型的多编程语言能力

MultiPL-MoE：通过混合专家模型扩展大型语言模型的多编程语言能力

Qing Wang, Xue Han, Jiahui Wang, et al.

CapRL：通过强化学习激发密集图像描述能力

CapRL：通过强化学习激发密集图像描述能力

Long Xing, Xiaoyi Dong, Yuhang Zang, et al.

通过离散扩散发散指令实现超快速语言生成

通过离散扩散发散指令实现超快速语言生成

Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.

DisCO：通过判别约束优化强化大型推理模型

DisCO：通过判别约束优化强化大型推理模型

Gang Li, Ming Lin, Tomer Galanti, et al.

QSVD：面向低精度视觉-语言模型中统一查询-键-值权重压缩的高效低秩近似

QSVD：面向低精度视觉-语言模型中统一查询-键-值权重压缩的高效低秩近似

Yutong Wang, Haiyu Wang, Sai Qian Zhang

嵌套学习：深度学习架构的幻觉

嵌套学习：深度学习架构的幻觉

自然语言处理

Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.

预算感知工具使用实现Agent的有效扩展

预算感知工具使用实现Agent的有效扩展

Tengxiao Liu, Zifeng Wang, Jin Miao, et al.

视频内指令：视觉信号作为生成控制

视频内指令：视觉信号作为生成控制

Gongfan Fang, Xinyin Ma, Xinchao Wang

DR Tulu：面向深度研究的基于演化评分标准的强化学习

DR Tulu：面向深度研究的基于演化评分标准的强化学习

Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.

AICC：精细化HTML解析，提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库

AICC：精细化HTML解析，提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库

Ren Ma, Jiantao Qiu, Chao Xu, et al.

UltraFlux：面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计

UltraFlux：面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计

Tian Ye, Song Fei, Lei Zhu

DeCo：面向端到端图像生成的频率解耦像素扩散

DeCo：面向端到端图像生成的频率解耦像素扩散

Zehong Ma, Longhui Wei, Shuai Wang, et al.

计算机操作 Agent 作为生成式用户界面的评判者

计算机操作 Agent 作为生成式用户界面的评判者

Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.

AutoEnv：衡量 Agent 跨环境学习的自动化环境

AutoEnv：衡量 Agent 跨环境学习的自动化环境

Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.

基于深度研究的通用 Agent 记忆

基于深度研究的通用 Agent 记忆

检索增强生成

B. Y. Yan, Chaofan Li, Hongjin Qian, et al.

VIRAL：面向人形机器人运动操作的规模化视觉仿真到现实迁移

VIRAL：面向人形机器人运动操作的规模化视觉仿真到现实迁移

计算机视觉

Tairan He, Zi Wang, Haoru Xue, et al.

MIST：基于监督训练的互信息

MIST：基于监督训练的互信息

German Gritsai, Megan Richards, Maxime Méloux, et al.

多Agent深度研究：基于M-GRPO训练多Agent系统

多Agent深度研究：基于M-GRPO训练多Agent系统

Haoyang Hong, Jiajun Yin, Yuan Wang, et al.

无数据流程图提炼

无数据流程图提炼

Shangyuan Tong, Nanye Ma, Saining Xie, et al.

HunyuanOCR 技术报告

HunyuanOCR 技术报告

Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.

PhysToolBench：面向MLLMs的物理工具理解能力评估

PhysToolBench：面向MLLMs的物理工具理解能力评估

Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.

赫胥黎-哥德尔机器：通过最优自改进机器的近似实现人类水平的编码Agent开发

赫胥黎-哥德尔机器：通过最优自改进机器的近似实现人类水平的编码Agent开发

Wenyi Wang, Piotr Piękos, Li Nanbo, et al.

无需空间超感知的空间超感知求解

无需空间超感知的空间超感知求解

计算机视觉

Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.

Parrot：输出真实性的说服与认同鲁棒性评级——面向 LLMs 的阿谀鲁棒性基准

Parrot：输出真实性的说服与认同鲁棒性评级——面向 LLMs 的阿谀鲁棒性基准

Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli

O-Mem：面向个性化、长跨度及自进化 Agents 的全能记忆系统

O-Mem：面向个性化、长跨度及自进化 Agents 的全能记忆系统

Piaohong Wang, Motong Tian, Jiaxian Li, et al.

揭示文本本征维度：从学术摘要到创意故事

揭示文本本征维度：从学术摘要到创意故事

自然语言处理

Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.

SAM 3：基于概念的万物分割

SAM 3：基于概念的万物分割

计算机视觉

Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.

GeoVista：面向地理定位的网络增强 Agent 视觉推理

GeoVista：面向地理定位的网络增强 Agent 视觉推理

检索增强生成

Yikun Wang, Zuyan Liu, Ziyi Wang, et al.

OpenMMReasoner：以开放与通用的方案拓展多模态推理的前沿

OpenMMReasoner：以开放与通用的方案拓展多模态推理的前沿

监督式微调

Kaichen Zhang, Keming Wu, Zuhao Yang, et al.

HiPO：面向LLMs动态推理的混合策略优化

HiPO：面向LLMs动态推理的混合策略优化

Ken Deng, Zizheng Zhan, Wen Xiang, et al.

SERES：基于语义感知的稀疏视角神经重建

SERES：基于语义感知的稀疏视角神经重建

计算机视觉

Bo Xu, Yuhu Guo, Yuchao Wang, et al.

SDAR：一种用于可扩展序列生成的协同扩散-自回归范式

SDAR：一种用于可扩展序列生成的协同扩散-自回归范式

Shuang Cheng, Yihan Bian, Dawei Liu, et al.

MultiPL-MoE：通过混合专家模型扩展大型语言模型的多编程语言能力

MultiPL-MoE：通过混合专家模型扩展大型语言模型的多编程语言能力

Qing Wang, Xue Han, Jiahui Wang, et al.

CapRL：通过强化学习激发密集图像描述能力

CapRL：通过强化学习激发密集图像描述能力

Long Xing, Xiaoyi Dong, Yuhang Zang, et al.

通过离散扩散发散指令实现超快速语言生成

通过离散扩散发散指令实现超快速语言生成

Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.

DisCO：通过判别约束优化强化大型推理模型

DisCO：通过判别约束优化强化大型推理模型

Gang Li, Ming Lin, Tomer Galanti, et al.

QSVD：面向低精度视觉-语言模型中统一查询-键-值权重压缩的高效低秩近似

QSVD：面向低精度视觉-语言模型中统一查询-键-值权重压缩的高效低秩近似

Yutong Wang, Haiyu Wang, Sai Qian Zhang

嵌套学习：深度学习架构的幻觉

嵌套学习：深度学习架构的幻觉

自然语言处理

Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.