HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

通义千问3-VL 技术报告

通义千问3-VL 技术报告

统一多模态

多模态表征

Shuai Bai, Yuxuan Cai, Ruizhe Chen, et al.

G$^2$VLM：具有统一3D重建与空间推理能力的几何引导视觉语言模型

G$^2$VLM：具有统一3D重建与空间推理能力的几何引导视觉语言模型

多模态表征

Wenbo Hu, Jingli Lin, Yilin Long, et al.

Multi-Crit：基于多元标准遵循的多模态评判基准

Multi-Crit：基于多元标准遵循的多模态评判基准

Tianyi Xiong, Yi Ge, Ming Li, et al.

MIRA：用于图像编辑的多模态迭代推理Agent

MIRA：用于图像编辑的多模态迭代推理Agent

Ziyun Zeng, Hang Hua, Jiebo Luo

ENACT：基于第一人称交互世界建模的具身认知评估

ENACT：基于第一人称交互世界建模的具身认知评估

Qineng Wang, Wenlong Huang, Yu Zhou, et al.

画布到图像：基于多模态控制的组合图像生成

画布到图像：基于多模态控制的组合图像生成

Yusuf Dalva, Guocheng Gordon Qian, Maya Goldenberg, et al.

视频生成模型是优秀的潜在奖励模型

视频生成模型是优秀的潜在奖励模型

统一多模态

Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.

DeepSeekMath-V2：迈向自验证的数学推理

DeepSeekMath-V2：迈向自验证的数学推理

Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.

ToolOrchestra：通过高效的模型与工具编排提升智能

ToolOrchestra：通过高效的模型与工具编排提升智能

Hongjin Su, Shizhe Diao, Ximing Lu, et al.

视觉思考，文本推理：ARC中的视觉-语言协同作用

视觉思考，文本推理：ARC中的视觉-语言协同作用

Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.

和谐：通过跨任务协同实现音频与视频生成的协同统一

和谐：通过跨任务协同实现音频与视频生成的协同统一

统一多模态

Teng Hu, Zhentao Yu, Guozhen Zhang, et al.

Inferix：一种基于块扩散的下一代推理引擎，用于世界模拟

Inferix：一种基于块扩散的下一代推理引擎，用于世界模拟

Inferix Team, Tianyu Feng, Yizeng Han, et al.

多智能体系统中的潜在协作

多智能体系统中的潜在协作

Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.

多模态评估俄语语言架构

多模态评估俄语语言架构

Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.

ROOT：用于神经网络训练的鲁棒正交化优化器

ROOT：用于神经网络训练的鲁棒正交化优化器

Wei He, Kai Han, Hang Zhou, et al.

叠加效应带来稳健的神经缩放

叠加效应带来稳健的神经缩放

Yizhou Liu, Ziming Liu, Jeff Gore

直接在线学习的最优错误界

直接在线学习的最优错误界

Zachary Chase, Steve Hanneke, Shay Moran, et al.

强化学习是否真的能够激励LLM在基础模型之外提升推理能力？

强化学习是否真的能够激励LLM在基础模型之外提升推理能力？

Yang Yue, Zhiqi Chen, Rui Lu, et al.

扩散模型为何不会记忆：训练中隐式动力学正则化的作用

扩散模型为何不会记忆：训练中隐式动力学正则化的作用

Tony Bonnaire, Raphaël Urfin, Giulio Biroli, et al.

用于自监督强化学习的1000层网络：增加深度可实现新的目标达成能力

用于自监督强化学习的1000层网络：增加深度可实现新的目标达成能力

Kevin Wang, Ishaan Javali, Michał Bortkiewicz, et al.

用于大型语言模型的门控注意力：非线性、稀疏性与无注意力陷阱

用于大型语言模型的门控注意力：非线性、稀疏性与无注意力陷阱

Zihan Qiu, Zekun Wang, Bo Zheng, et al.

人工蜂群智能：语言模型（及更广泛领域）的开放性同质性

人工蜂群智能：语言模型（及更广泛领域）的开放性同质性

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

超大规模下的进化策略

超大规模下的进化策略

Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.

理解是否推动统一多模态模型中的生成？从分析到未来路径

理解是否推动统一多模态模型中的生成？从分析到未来路径

统一多模态

Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.

iMontage：统一、通用、高度动态的多对多图像生成

iMontage：统一、通用、高度动态的多对多图像生成

统一多模态

Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.

Agent0-VL：探索面向工具融合的视觉-语言推理的自演化智能体

Agent0-VL：探索面向工具融合的视觉-语言推理的自演化智能体

Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.

MedSAM3：基于医学概念深入探索通用图像分割

MedSAM3：基于医学概念深入探索通用图像分割

统一多模态

Anglin Liu, Rundong Xue, Xu R. Cao, et al.

SteadyDancer：基于首帧保留的协调一致的人体图像动画

SteadyDancer：基于首帧保留的协调一致的人体图像动画

Jiaming Zhang, Shengming Cao, Rui Li, et al.

GigaEvo：一个由 LLMs 和进化算法驱动的开源优化框架

GigaEvo：一个由 LLMs 和进化算法驱动的开源优化框架

Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.

基于随机路径积分的忠实度感知推荐解释

基于随机路径积分的忠实度感知推荐解释

Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.

提取推荐系统中的交互感知单语义概念

提取推荐系统中的交互感知单语义概念

Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.

MSRNet：用于伪装目标检测的多尺度递归网络

MSRNet：用于伪装目标检测的多尺度递归网络

Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.

通义千问3-VL 技术报告

通义千问3-VL 技术报告

统一多模态

多模态表征

Shuai Bai, Yuxuan Cai, Ruizhe Chen, et al.

G$^2$VLM：具有统一3D重建与空间推理能力的几何引导视觉语言模型

G$^2$VLM：具有统一3D重建与空间推理能力的几何引导视觉语言模型

多模态表征

Wenbo Hu, Jingli Lin, Yilin Long, et al.

Multi-Crit：基于多元标准遵循的多模态评判基准

Multi-Crit：基于多元标准遵循的多模态评判基准

Tianyi Xiong, Yi Ge, Ming Li, et al.

MIRA：用于图像编辑的多模态迭代推理Agent

MIRA：用于图像编辑的多模态迭代推理Agent

Ziyun Zeng, Hang Hua, Jiebo Luo

ENACT：基于第一人称交互世界建模的具身认知评估

ENACT：基于第一人称交互世界建模的具身认知评估

Qineng Wang, Wenlong Huang, Yu Zhou, et al.

画布到图像：基于多模态控制的组合图像生成

画布到图像：基于多模态控制的组合图像生成

Yusuf Dalva, Guocheng Gordon Qian, Maya Goldenberg, et al.

视频生成模型是优秀的潜在奖励模型

视频生成模型是优秀的潜在奖励模型

统一多模态

Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.

DeepSeekMath-V2：迈向自验证的数学推理

DeepSeekMath-V2：迈向自验证的数学推理

Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.

ToolOrchestra：通过高效的模型与工具编排提升智能

ToolOrchestra：通过高效的模型与工具编排提升智能

Hongjin Su, Shizhe Diao, Ximing Lu, et al.

视觉思考，文本推理：ARC中的视觉-语言协同作用

视觉思考，文本推理：ARC中的视觉-语言协同作用

Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.

和谐：通过跨任务协同实现音频与视频生成的协同统一

和谐：通过跨任务协同实现音频与视频生成的协同统一

统一多模态

Teng Hu, Zhentao Yu, Guozhen Zhang, et al.

Inferix：一种基于块扩散的下一代推理引擎，用于世界模拟

Inferix：一种基于块扩散的下一代推理引擎，用于世界模拟

Inferix Team, Tianyu Feng, Yizeng Han, et al.

多智能体系统中的潜在协作

多智能体系统中的潜在协作

Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.

多模态评估俄语语言架构

多模态评估俄语语言架构

Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.

ROOT：用于神经网络训练的鲁棒正交化优化器

ROOT：用于神经网络训练的鲁棒正交化优化器

Wei He, Kai Han, Hang Zhou, et al.

叠加效应带来稳健的神经缩放

叠加效应带来稳健的神经缩放

Yizhou Liu, Ziming Liu, Jeff Gore

直接在线学习的最优错误界

直接在线学习的最优错误界

Zachary Chase, Steve Hanneke, Shay Moran, et al.

强化学习是否真的能够激励LLM在基础模型之外提升推理能力？

强化学习是否真的能够激励LLM在基础模型之外提升推理能力？

Yang Yue, Zhiqi Chen, Rui Lu, et al.

扩散模型为何不会记忆：训练中隐式动力学正则化的作用

扩散模型为何不会记忆：训练中隐式动力学正则化的作用

Tony Bonnaire, Raphaël Urfin, Giulio Biroli, et al.

用于自监督强化学习的1000层网络：增加深度可实现新的目标达成能力

用于自监督强化学习的1000层网络：增加深度可实现新的目标达成能力

Kevin Wang, Ishaan Javali, Michał Bortkiewicz, et al.

用于大型语言模型的门控注意力：非线性、稀疏性与无注意力陷阱

用于大型语言模型的门控注意力：非线性、稀疏性与无注意力陷阱

Zihan Qiu, Zekun Wang, Bo Zheng, et al.

人工蜂群智能：语言模型（及更广泛领域）的开放性同质性

人工蜂群智能：语言模型（及更广泛领域）的开放性同质性

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

超大规模下的进化策略

超大规模下的进化策略

Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.

理解是否推动统一多模态模型中的生成？从分析到未来路径

理解是否推动统一多模态模型中的生成？从分析到未来路径

统一多模态

Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.

iMontage：统一、通用、高度动态的多对多图像生成

iMontage：统一、通用、高度动态的多对多图像生成

统一多模态

Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.

Agent0-VL：探索面向工具融合的视觉-语言推理的自演化智能体

Agent0-VL：探索面向工具融合的视觉-语言推理的自演化智能体

Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.

MedSAM3：基于医学概念深入探索通用图像分割

MedSAM3：基于医学概念深入探索通用图像分割

统一多模态

Anglin Liu, Rundong Xue, Xu R. Cao, et al.

SteadyDancer：基于首帧保留的协调一致的人体图像动画

SteadyDancer：基于首帧保留的协调一致的人体图像动画

Jiaming Zhang, Shengming Cao, Rui Li, et al.

GigaEvo：一个由 LLMs 和进化算法驱动的开源优化框架

GigaEvo：一个由 LLMs 和进化算法驱动的开源优化框架

Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.

基于随机路径积分的忠实度感知推荐解释

基于随机路径积分的忠实度感知推荐解释

Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.

提取推荐系统中的交互感知单语义概念

提取推荐系统中的交互感知单语义概念

Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.

MSRNet：用于伪装目标检测的多尺度递归网络

MSRNet：用于伪装目标检测的多尺度递归网络

Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.