HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

UniREditBench：一个统一的基于推理的图像编辑基准

UniREditBench：一个统一的基于推理的图像编辑基准

Feng Han, Yibin Wang, Chenglin Li, et al.

将测试时计算最优缩放泛化为可优化图

将测试时计算最优缩放泛化为可优化图

Fali Wang, Jihai Chen, Shuhua Yang, et al.

UniLumos：基于物理合理反馈的快速统一图像与视频重光照

UniLumos：基于物理合理反馈的快速统一图像与视频重光照

Ropeway Liu, Hangjie Yuan, Bo Dong, et al.

视觉模型在图结构理解中的被低估的力量

视觉模型在图结构理解中的被低估的力量

计算机视觉

Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.

每一次激活都更进一步：将通用推理器扩展至1万亿开放语言基础

每一次激活都更进一步：将通用推理器扩展至1万亿开放语言基础

Ling-Team, Ang Li, Ben Liu, et al.

NOBLE - 具有生物启发的潜在嵌入的神经算子，用于捕捉生物神经元模型中的实验变异性

NOBLE - 具有生物启发的潜在嵌入的神经算子，用于捕捉生物神经元模型中的实验变异性

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.

胶质细胞：一种受人类启发的用于自动化系统设计与优化的AI

胶质细胞：一种受人类启发的用于自动化系统设计与优化的AI

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.

上下文工程2.0：上下文工程的上下文

上下文工程2.0：上下文工程的上下文

Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.

空间-SSRL：通过自监督强化学习增强空间理解

空间-SSRL：通过自监督强化学习增强空间理解

计算机视觉

Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.

连续自回归语言模型

连续自回归语言模型

Chenze Shao, Darren Li, Fandong Meng, et al.

π𝚁𝙻：基于流的视觉-语言-动作模型的在线RL微调

π𝚁𝙻：基于流的视觉-语言-动作模型的在线RL微调

监督式微调

Kang Chen, Zhihao Liu, Tonghe Zhang, et al.

INT 与 FP：细粒度低比特量化格式的综合研究

INT 与 FP：细粒度低比特量化格式的综合研究

Mengzhao Chen, Meng Wu, Hui Jin, et al.

ThinkMorph：多模态交错思维链推理中的涌现特性

ThinkMorph：多模态交错思维链推理中的涌现特性

Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.

OS-Sentinel：通过在真实工作流中混合验证实现安全增强的移动GUI Agent

OS-Sentinel：通过在真实工作流中混合验证实现安全增强的移动GUI Agent

Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.

代理型组织时代：与语言模型共同学习组织之道

代理型组织时代：与语言模型共同学习组织之道

Zewen Chi, Li Dong, Qingxiu Dong, et al.

SPICE：在语料库环境中进行自对弈提升推理能力

SPICE：在语料库环境中进行自对弈提升推理能力

Bo Liu, Chuanyang Jin, Seungone Kim, et al.

Surfer 2：下一代跨平台计算机使用Agent

Surfer 2：下一代跨平台计算机使用Agent

Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.

扩散模型在机器人控制中的应用条件探索

扩散模型在机器人控制中的应用条件探索

机器人技术

Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.

Agent 能否征服网络？探索 ChatGPT Atlas Agent 在网络游戏中的前沿应用

Agent 能否征服网络？探索 ChatGPT Atlas Agent 在网络游戏中的前沿应用

Jingran Zhang, Ning Li, Justin Cui

Kimi Linear：一种表达性强、高效的Attention架构

Kimi Linear：一种表达性强、高效的Attention架构

Kimi Team, Yu Zhang, Zongyu Lin, et al.

Emu3.5：原生多模态模型是世界学习者

Emu3.5：原生多模态模型是世界学习者

统一多模态

Yufeng Cui, Honghao Chen, Haoge Deng, et al.

手动解码的终结：迈向真正端到端的语言模型

手动解码的终结：迈向真正端到端的语言模型

Zhichao Wang, Dongyang Ma, Xinting Huang, et al.

人类与AI的互补性：增强监督的目标

人类与AI的互补性：增强监督的目标

自然语言处理

Rishub Jain, Sophie Bridgers, Lili Janzer, et al.

GPTOpt：面向高效基于LLM的黑箱优化

GPTOpt：面向高效基于LLM的黑箱优化

监督式微调

Jamison Meindl, Yunsheng Tian, Tony Cui, et al.

VFXMaster：通过上下文学习解锁动态视觉效果生成

VFXMaster：通过上下文学习解锁动态视觉效果生成

Baolu Li, Yiming Zhang, Qinghe Wang, et al.

基于流程挖掘的推理感知GRPO

基于流程挖掘的推理感知GRPO

Taekhyun Park, Yongjae Lee, Hyerim Bae

通过循环语言模型实现潜在推理的扩展

通过循环语言模型实现潜在推理的扩展

Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.

ReForm：基于前瞻性有限序列优化的反思式自动形式化

ReForm：基于前瞻性有限序列优化的反思式自动形式化

Guoxin Chen, Jing Wu, Xinjie Chen, et al.

Video-Thinker：通过强化学习激发“用视频进行思考”

Video-Thinker：通过强化学习激发“用视频进行思考”

Shijian Wang, Jiarui Jin, Xingjian Wang, et al.

JanusCoder：迈向代码智能的基础性视觉-程序化接口

JanusCoder：迈向代码智能的基础性视觉-程序化接口

Qiushi Sun, Jingyang Gong, Yang Liu, et al.

MCP-Flow：助力LLM Agent掌握现实世界中多样化且可扩展的MCP工具

MCP-Flow：助力LLM Agent掌握现实世界中多样化且可扩展的MCP工具

Wenhao Wang, Peizhi Niu, Zhao Xu, et al.

OmniCast：一种用于跨时间尺度天气预报的掩码潜在扩散模型

OmniCast：一种用于跨时间尺度天气预报的掩码潜在扩散模型

Tung Nguyen, Tuan Pham, Troy Arcomano, et al.

UniREditBench：一个统一的基于推理的图像编辑基准

UniREditBench：一个统一的基于推理的图像编辑基准

Feng Han, Yibin Wang, Chenglin Li, et al.

将测试时计算最优缩放泛化为可优化图

将测试时计算最优缩放泛化为可优化图

Fali Wang, Jihai Chen, Shuhua Yang, et al.

UniLumos：基于物理合理反馈的快速统一图像与视频重光照

UniLumos：基于物理合理反馈的快速统一图像与视频重光照

Ropeway Liu, Hangjie Yuan, Bo Dong, et al.

视觉模型在图结构理解中的被低估的力量

视觉模型在图结构理解中的被低估的力量

计算机视觉

Xinjian Zhao, Wei Pang, Zhongkai Xue, et al.

每一次激活都更进一步：将通用推理器扩展至1万亿开放语言基础

每一次激活都更进一步：将通用推理器扩展至1万亿开放语言基础

Ling-Team, Ang Li, Ben Liu, et al.

NOBLE - 具有生物启发的潜在嵌入的神经算子，用于捕捉生物神经元模型中的实验变异性

NOBLE - 具有生物启发的潜在嵌入的神经算子，用于捕捉生物神经元模型中的实验变异性

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams, et al.

胶质细胞：一种受人类启发的用于自动化系统设计与优化的AI

胶质细胞：一种受人类启发的用于自动化系统设计与优化的AI

Pouya Hamadanian, Pantea Karimi, Arash Nasr-Esfahany, et al.

上下文工程2.0：上下文工程的上下文

上下文工程2.0：上下文工程的上下文

Qishuo Hua, Lyumanshan Ye, Dayuan Fu, et al.

空间-SSRL：通过自监督强化学习增强空间理解

空间-SSRL：通过自监督强化学习增强空间理解

计算机视觉

Yuhong Liu, Beichen Zhang, Yuhang Zang, et al.

连续自回归语言模型

连续自回归语言模型

Chenze Shao, Darren Li, Fandong Meng, et al.

π𝚁𝙻：基于流的视觉-语言-动作模型的在线RL微调

π𝚁𝙻：基于流的视觉-语言-动作模型的在线RL微调

监督式微调

Kang Chen, Zhihao Liu, Tonghe Zhang, et al.

INT 与 FP：细粒度低比特量化格式的综合研究

INT 与 FP：细粒度低比特量化格式的综合研究

Mengzhao Chen, Meng Wu, Hui Jin, et al.

ThinkMorph：多模态交错思维链推理中的涌现特性

ThinkMorph：多模态交错思维链推理中的涌现特性

Jiawei Gu, Yunzhuo Hao, Huichen Will Wang, et al.

OS-Sentinel：通过在真实工作流中混合验证实现安全增强的移动GUI Agent

OS-Sentinel：通过在真实工作流中混合验证实现安全增强的移动GUI Agent

Qiushi Sun, Mukai Li, Zhoumianze Liu, et al.

代理型组织时代：与语言模型共同学习组织之道

代理型组织时代：与语言模型共同学习组织之道

Zewen Chi, Li Dong, Qingxiu Dong, et al.

SPICE：在语料库环境中进行自对弈提升推理能力

SPICE：在语料库环境中进行自对弈提升推理能力

Bo Liu, Chuanyang Jin, Seungone Kim, et al.

Surfer 2：下一代跨平台计算机使用Agent

Surfer 2：下一代跨平台计算机使用Agent

Mathieu Andreux, Märt Bakler, Yanael Barbier, et al.

扩散模型在机器人控制中的应用条件探索

扩散模型在机器人控制中的应用条件探索

机器人技术

Heeseong Shin, Byeongho Heo, Dongyoon Han, et al.

Agent 能否征服网络？探索 ChatGPT Atlas Agent 在网络游戏中的前沿应用

Agent 能否征服网络？探索 ChatGPT Atlas Agent 在网络游戏中的前沿应用

Jingran Zhang, Ning Li, Justin Cui

Kimi Linear：一种表达性强、高效的Attention架构

Kimi Linear：一种表达性强、高效的Attention架构

Kimi Team, Yu Zhang, Zongyu Lin, et al.

Emu3.5：原生多模态模型是世界学习者

Emu3.5：原生多模态模型是世界学习者

统一多模态

Yufeng Cui, Honghao Chen, Haoge Deng, et al.

手动解码的终结：迈向真正端到端的语言模型

手动解码的终结：迈向真正端到端的语言模型

Zhichao Wang, Dongyang Ma, Xinting Huang, et al.

人类与AI的互补性：增强监督的目标

人类与AI的互补性：增强监督的目标

自然语言处理

Rishub Jain, Sophie Bridgers, Lili Janzer, et al.

GPTOpt：面向高效基于LLM的黑箱优化

GPTOpt：面向高效基于LLM的黑箱优化

监督式微调

Jamison Meindl, Yunsheng Tian, Tony Cui, et al.

VFXMaster：通过上下文学习解锁动态视觉效果生成

VFXMaster：通过上下文学习解锁动态视觉效果生成

Baolu Li, Yiming Zhang, Qinghe Wang, et al.

基于流程挖掘的推理感知GRPO

基于流程挖掘的推理感知GRPO

Taekhyun Park, Yongjae Lee, Hyerim Bae

通过循环语言模型实现潜在推理的扩展

通过循环语言模型实现潜在推理的扩展

Rui-Jie Zhu, Zixuan Wang, Kai Hua, et al.

ReForm：基于前瞻性有限序列优化的反思式自动形式化

ReForm：基于前瞻性有限序列优化的反思式自动形式化

Guoxin Chen, Jing Wu, Xinjie Chen, et al.

Video-Thinker：通过强化学习激发“用视频进行思考”

Video-Thinker：通过强化学习激发“用视频进行思考”

Shijian Wang, Jiarui Jin, Xingjian Wang, et al.

JanusCoder：迈向代码智能的基础性视觉-程序化接口

JanusCoder：迈向代码智能的基础性视觉-程序化接口

Qiushi Sun, Jingyang Gong, Yang Liu, et al.

MCP-Flow：助力LLM Agent掌握现实世界中多样化且可扩展的MCP工具

MCP-Flow：助力LLM Agent掌握现实世界中多样化且可扩展的MCP工具

Wenhao Wang, Peizhi Niu, Zhao Xu, et al.

OmniCast：一种用于跨时间尺度天气预报的掩码潜在扩散模型

OmniCast：一种用于跨时间尺度天气预报的掩码潜在扩散模型

Tung Nguyen, Tuan Pham, Troy Arcomano, et al.