HyperAI超神经

文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会

关于服务条款隐私政策
中文

HyperAI超神经

Command Palette

Search for a command to run...

首页
论文

论文

每日更新的前沿 AI 研究论文，助您把握人工智能最新动向

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集帮助

产品

资讯教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI超神经

津ICP备17010941号-1

京公网安备11010502038810号

Discord X (formerly Twitter)Bilibili

HyperAI超神经

文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会

关于服务条款隐私政策
中文

HyperAI超神经

Command Palette

Search for a command to run...

首页
论文

论文

每日更新的前沿 AI 研究论文，助您把握人工智能最新动向

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集帮助

产品

资讯教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI超神经

津ICP备17010941号-1

京公网安备11010502038810号

Discord X (formerly Twitter)Bilibili

论文 | HyperAI超神经

分享即关爱：基于集体强化学习经验共享的高效LM后训练

分享即关爱：基于集体强化学习经验共享的高效LM后训练

Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.

FinReflectKG：金融知识图谱的智能体构建与评估

FinReflectKG：金融知识图谱的智能体构建与评估

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.

大规模推理模型的强化学习研究综述

大规模推理模型的强化学习研究综述

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.

F1：一种连接理解与生成到行动的视觉-语言-行动模型

F1：一种连接理解与生成到行动的视觉-语言-行动模型

Qi Lv, Weijie Kong, Hao Li, et al.

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.

重建对齐提升统一多模态模型

重建对齐提升统一多模态模型

Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

Xin Lai, Junyi Li, Wei Li, et al.

多模态大语言模型的视觉表征对齐

多模态大语言模型的视觉表征对齐

Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.

并行-R1：通过强化学习实现并行思维

并行-R1：通过强化学习实现并行思维

Tong Zheng, Hongming Zhang, Wenhao Yu, et al.

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

Longhao Li, Zhao Guo, Hongjie Chen, et al.

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.

自主代码演化邂逅NP-完全性

自主代码演化邂逅NP-完全性

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.

深度研究系统中的强化学习基础：一项综述

深度研究系统中的强化学习基础：一项综述

Wenjun Li, Zhi Chen, Jingru Lin, et al.

工具增强的视觉感知

工具增强的视觉感知

Zetong Zhou, Dongping Chen, Zixian Ma, et al.

DINOv3 是否设定了新的医学视觉标准？

DINOv3 是否设定了新的医学视觉标准？

Che Liu, Yinda Chen, Haoyuan Shi, et al.

用于扩散大语言模型的强化学习框架的革命性革新

用于扩散大语言模型的强化学习框架的革命性革新

Yinjie Wang, Ling Yang, Bowen Li, et al.

WebExplorer：用于训练长时序Web Agent的探索与演化

WebExplorer：用于训练长时序Web Agent的探索与演化

Junteng Liu, Yunji Li, Chi Zhang, et al.

逆向工程推理用于开放式生成

逆向工程推理用于开放式生成

Haozhe Wang, Haoran Que, Qixin Xu, et al.

OSC：多智能体LLM协作中的动态知识对齐认知编排

OSC：多智能体LLM协作中的动态知识对齐认知编排

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

LuxDiT：基于视频扩散Transformer的光照估计

LuxDiT：基于视频扩散Transformer的光照估计

Ruofan Liang, Kai He, Zan Gojcic, et al.

WildScore：在野符号音乐推理中对MLLMs的基准测试

WildScore：在野符号音乐推理中对MLLMs的基准测试

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

设置块解码是一种语言模型推理加速器

设置块解码是一种语言模型推理加速器

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

基于大型语言模型的符号图形编程

基于大型语言模型的符号图形编程

Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.

语言模型为何会产生幻觉

语言模型为何会产生幻觉

Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.

LatticeWorld：一种由多模态大语言模型驱动的交互式复杂世界生成框架

LatticeWorld：一种由多模态大语言模型驱动的交互式复杂世界生成框架

Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.

Recomposer：基于事件滚动引导的生成式音频编辑

Recomposer：基于事件滚动引导的生成式音频编辑

Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.

转换模型：重新思考生成式学习目标

转换模型：重新思考生成式学习目标

Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.

逆向 IFEval：LLMs 能否摒弃顽固的训练惯例以遵循真实指令？

逆向 IFEval：LLMs 能否摒弃顽固的训练惯例以遵循真实指令？

Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.

DeepResearch Arena：通过研讨会基础任务对LLMs研究能力的首次检验

DeepResearch Arena：通过研讨会基础任务对LLMs研究能力的首次检验

Haiyuan Wan, Chen Yang, Junchi Yu, et al.

分享即关爱：基于集体强化学习经验共享的高效LM后训练

分享即关爱：基于集体强化学习经验共享的高效LM后训练

Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.

FinReflectKG：金融知识图谱的智能体构建与评估

FinReflectKG：金融知识图谱的智能体构建与评估

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.

大规模推理模型的强化学习研究综述

大规模推理模型的强化学习研究综述

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.

F1：一种连接理解与生成到行动的视觉-语言-行动模型

F1：一种连接理解与生成到行动的视觉-语言-行动模型

Qi Lv, Weijie Kong, Hao Li, et al.

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.

重建对齐提升统一多模态模型

重建对齐提升统一多模态模型

Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

Xin Lai, Junyi Li, Wei Li, et al.

多模态大语言模型的视觉表征对齐

多模态大语言模型的视觉表征对齐

Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.

并行-R1：通过强化学习实现并行思维

并行-R1：通过强化学习实现并行思维

Tong Zheng, Hongming Zhang, Wenhao Yu, et al.

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

Longhao Li, Zhao Guo, Hongjie Chen, et al.

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.

自主代码演化邂逅NP-完全性

自主代码演化邂逅NP-完全性

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.

深度研究系统中的强化学习基础：一项综述

深度研究系统中的强化学习基础：一项综述

Wenjun Li, Zhi Chen, Jingru Lin, et al.

工具增强的视觉感知

工具增强的视觉感知

Zetong Zhou, Dongping Chen, Zixian Ma, et al.

DINOv3 是否设定了新的医学视觉标准？

DINOv3 是否设定了新的医学视觉标准？

Che Liu, Yinda Chen, Haoyuan Shi, et al.

用于扩散大语言模型的强化学习框架的革命性革新

用于扩散大语言模型的强化学习框架的革命性革新

Yinjie Wang, Ling Yang, Bowen Li, et al.

WebExplorer：用于训练长时序Web Agent的探索与演化

WebExplorer：用于训练长时序Web Agent的探索与演化

Junteng Liu, Yunji Li, Chi Zhang, et al.

逆向工程推理用于开放式生成

逆向工程推理用于开放式生成

Haozhe Wang, Haoran Que, Qixin Xu, et al.

OSC：多智能体LLM协作中的动态知识对齐认知编排

OSC：多智能体LLM协作中的动态知识对齐认知编排

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

LuxDiT：基于视频扩散Transformer的光照估计

LuxDiT：基于视频扩散Transformer的光照估计

Ruofan Liang, Kai He, Zan Gojcic, et al.

WildScore：在野符号音乐推理中对MLLMs的基准测试

WildScore：在野符号音乐推理中对MLLMs的基准测试

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

设置块解码是一种语言模型推理加速器

设置块解码是一种语言模型推理加速器

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

基于大型语言模型的符号图形编程

基于大型语言模型的符号图形编程

Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.

语言模型为何会产生幻觉

语言模型为何会产生幻觉

Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.

LatticeWorld：一种由多模态大语言模型驱动的交互式复杂世界生成框架

LatticeWorld：一种由多模态大语言模型驱动的交互式复杂世界生成框架

Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.

Recomposer：基于事件滚动引导的生成式音频编辑

Recomposer：基于事件滚动引导的生成式音频编辑

Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.

转换模型：重新思考生成式学习目标

转换模型：重新思考生成式学习目标

Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.

逆向 IFEval：LLMs 能否摒弃顽固的训练惯例以遵循真实指令？

逆向 IFEval：LLMs 能否摒弃顽固的训练惯例以遵循真实指令？

Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.

DeepResearch Arena：通过研讨会基础任务对LLMs研究能力的首次检验

DeepResearch Arena：通过研讨会基础任务对LLMs研究能力的首次检验

Haiyuan Wan, Chen Yang, Junchi Yu, et al.