HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

DINOv3 是否设定了新的医学视觉标准？

DINOv3 是否设定了新的医学视觉标准？

计算机视觉

Che Liu, Yinda Chen, Haoyuan Shi, et al.

用于扩散大语言模型的强化学习框架的革命性革新

用于扩散大语言模型的强化学习框架的革命性革新

监督式微调

Yinjie Wang, Ling Yang, Bowen Li, et al.

WebExplorer：用于训练长时序Web Agent的探索与演化

WebExplorer：用于训练长时序Web Agent的探索与演化

监督式微调

Junteng Liu, Yunji Li, Chi Zhang, et al.

逆向工程推理用于开放式生成

逆向工程推理用于开放式生成

Haozhe Wang, Haoran Que, Qixin Xu, et al.

OSC：多智能体LLM协作中的动态知识对齐认知编排

OSC：多智能体LLM协作中的动态知识对齐认知编排

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

自然语言处理

监督式微调

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

LuxDiT：基于视频扩散Transformer的光照估计

LuxDiT：基于视频扩散Transformer的光照估计

Ruofan Liang, Kai He, Zan Gojcic, et al.

WildScore：在野符号音乐推理中对MLLMs的基准测试

WildScore：在野符号音乐推理中对MLLMs的基准测试

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

设置块解码是一种语言模型推理加速器

设置块解码是一种语言模型推理加速器

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

基于大型语言模型的符号图形编程

基于大型语言模型的符号图形编程

Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.

语言模型为何会产生幻觉

语言模型为何会产生幻觉

Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.

LatticeWorld：一种由多模态大语言模型驱动的交互式复杂世界生成框架

LatticeWorld：一种由多模态大语言模型驱动的交互式复杂世界生成框架

Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.

Recomposer：基于事件滚动引导的生成式音频编辑

Recomposer：基于事件滚动引导的生成式音频编辑

Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.

转换模型：重新思考生成式学习目标

转换模型：重新思考生成式学习目标

Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.

逆向 IFEval：LLMs 能否摒弃顽固的训练惯例以遵循真实指令？

逆向 IFEval：LLMs 能否摒弃顽固的训练惯例以遵循真实指令？

监督式微调

Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.

DeepResearch Arena：通过研讨会基础任务对LLMs研究能力的首次检验

DeepResearch Arena：通过研讨会基础任务对LLMs研究能力的首次检验

Haiyuan Wan, Chen Yang, Junchi Yu, et al.

迈向大语言模型后训练的统一视角

迈向大语言模型后训练的统一视角

监督式微调

Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.

从编辑到密集几何估计器

从编辑到密集几何估计器

JiYuan Wang, Chunyu Lin, Lei Sun, et al.

Drivel-ology：通过深度解读荒谬内容挑战LLM

Drivel-ology：通过深度解读荒谬内容挑战LLM

Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.

龙：通过验证器实现大规模长链思维合成

龙：通过验证器实现大规模长链思维合成

Xingyue Huang, Rishabh, Gregor Franke, et al.

ArcMemo：基于持续学习LLM记忆的抽象推理组合

ArcMemo：基于持续学习LLM记忆的抽象推理组合

Matthew Ho, Chen Si, Zhaoxiang Feng, et al.

CoT-Space：通过强化学习实现内部慢思考的理论框架

CoT-Space：通过强化学习实现内部慢思考的理论框架

Zeyu Gan, Hao Yi, Yong Liu

多视角三维点跟踪

多视角三维点跟踪

机器视觉 3D

Frano Rajič, Haofei Xu, Marko Mihajlovic, et al.

2022年Landslide4Sense竞赛结果：基于多源卫星影像的先进滑坡检测

2022年Landslide4Sense竞赛结果：基于多源卫星影像的先进滑坡检测

计算机视觉

Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.

MOSAIC：通过对应感知对齐与解耦实现多主体个性化生成

MOSAIC：通过对应感知对齐与解耦实现多主体个性化生成

Dong She, Siming Fu, Mushui Liu, et al.

基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成

基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成

Xuechao Zou, Shun Zhang, Xing Fu, et al.

基于嵌入的检索的理论局限性

基于嵌入的检索的理论局限性

检索增强生成

Orion Weller, Michael Boratko, Iftekhar Naim, et al.

LMEnt：一种从预训练数据到表征分析语言模型知识的工具套件

LMEnt：一种从预训练数据到表征分析语言模型知识的工具套件

Daniela Gottesman, Alon Gilae-Dotan, Ido Cohen, et al.

开放数据合成用于深度研究

开放数据合成用于深度研究

Ziyi Xia, Kun Luo, Hongjin Qian, et al.

Robix：一种用于机器人交互、推理与规划的统一模型

Robix：一种用于机器人交互、推理与规划的统一模型

机器人技术

Huang Fang, Mengxi Zhang, Heng Dong, et al.

对语言模型进行红队测试以减少危害：方法、扩展行为与经验教训

对语言模型进行红队测试以减少危害：方法、扩展行为与经验教训

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

DINOv3 是否设定了新的医学视觉标准？

DINOv3 是否设定了新的医学视觉标准？

计算机视觉

Che Liu, Yinda Chen, Haoyuan Shi, et al.

用于扩散大语言模型的强化学习框架的革命性革新

用于扩散大语言模型的强化学习框架的革命性革新

监督式微调

Yinjie Wang, Ling Yang, Bowen Li, et al.

WebExplorer：用于训练长时序Web Agent的探索与演化

WebExplorer：用于训练长时序Web Agent的探索与演化

监督式微调

Junteng Liu, Yunji Li, Chi Zhang, et al.

逆向工程推理用于开放式生成

逆向工程推理用于开放式生成

Haozhe Wang, Haoran Que, Qixin Xu, et al.

OSC：多智能体LLM协作中的动态知识对齐认知编排

OSC：多智能体LLM协作中的动态知识对齐认知编排

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

自然语言处理

监督式微调

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

LuxDiT：基于视频扩散Transformer的光照估计

LuxDiT：基于视频扩散Transformer的光照估计

Ruofan Liang, Kai He, Zan Gojcic, et al.

WildScore：在野符号音乐推理中对MLLMs的基准测试

WildScore：在野符号音乐推理中对MLLMs的基准测试

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

设置块解码是一种语言模型推理加速器

设置块解码是一种语言模型推理加速器

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

基于大型语言模型的符号图形编程

基于大型语言模型的符号图形编程

Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.

语言模型为何会产生幻觉

语言模型为何会产生幻觉

Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.

LatticeWorld：一种由多模态大语言模型驱动的交互式复杂世界生成框架

LatticeWorld：一种由多模态大语言模型驱动的交互式复杂世界生成框架

Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.

Recomposer：基于事件滚动引导的生成式音频编辑

Recomposer：基于事件滚动引导的生成式音频编辑

Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.

转换模型：重新思考生成式学习目标

转换模型：重新思考生成式学习目标

Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.

逆向 IFEval：LLMs 能否摒弃顽固的训练惯例以遵循真实指令？

逆向 IFEval：LLMs 能否摒弃顽固的训练惯例以遵循真实指令？

监督式微调

Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.

DeepResearch Arena：通过研讨会基础任务对LLMs研究能力的首次检验

DeepResearch Arena：通过研讨会基础任务对LLMs研究能力的首次检验

Haiyuan Wan, Chen Yang, Junchi Yu, et al.

迈向大语言模型后训练的统一视角

迈向大语言模型后训练的统一视角

监督式微调

Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.

从编辑到密集几何估计器

从编辑到密集几何估计器

JiYuan Wang, Chunyu Lin, Lei Sun, et al.

Drivel-ology：通过深度解读荒谬内容挑战LLM

Drivel-ology：通过深度解读荒谬内容挑战LLM

Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.

龙：通过验证器实现大规模长链思维合成

龙：通过验证器实现大规模长链思维合成

Xingyue Huang, Rishabh, Gregor Franke, et al.

ArcMemo：基于持续学习LLM记忆的抽象推理组合

ArcMemo：基于持续学习LLM记忆的抽象推理组合

Matthew Ho, Chen Si, Zhaoxiang Feng, et al.

CoT-Space：通过强化学习实现内部慢思考的理论框架

CoT-Space：通过强化学习实现内部慢思考的理论框架

Zeyu Gan, Hao Yi, Yong Liu

多视角三维点跟踪

多视角三维点跟踪

机器视觉 3D

Frano Rajič, Haofei Xu, Marko Mihajlovic, et al.

2022年Landslide4Sense竞赛结果：基于多源卫星影像的先进滑坡检测

2022年Landslide4Sense竞赛结果：基于多源卫星影像的先进滑坡检测

计算机视觉

Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.

MOSAIC：通过对应感知对齐与解耦实现多主体个性化生成

MOSAIC：通过对应感知对齐与解耦实现多主体个性化生成

Dong She, Siming Fu, Mushui Liu, et al.

基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成

基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成

Xuechao Zou, Shun Zhang, Xing Fu, et al.

基于嵌入的检索的理论局限性

基于嵌入的检索的理论局限性

检索增强生成

Orion Weller, Michael Boratko, Iftekhar Naim, et al.

LMEnt：一种从预训练数据到表征分析语言模型知识的工具套件

LMEnt：一种从预训练数据到表征分析语言模型知识的工具套件

Daniela Gottesman, Alon Gilae-Dotan, Ido Cohen, et al.

开放数据合成用于深度研究

开放数据合成用于深度研究

Ziyi Xia, Kun Luo, Hongjin Qian, et al.

Robix：一种用于机器人交互、推理与规划的统一模型

Robix：一种用于机器人交互、推理与规划的统一模型

机器人技术

Huang Fang, Mengxi Zhang, Heng Dong, et al.

对语言模型进行红队测试以减少危害：方法、扩展行为与经验教训

对语言模型进行红队测试以减少危害：方法、扩展行为与经验教训

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.