HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

思维链自指导：为推理与非推理任务构建高质量的合成提示

思维链自指导：为推理与非推理任务构建高质量的合成提示

Ping Yu, Jack Lanchantin, Tianlu Wang, et al.

指向性音视频分割中的全模态表达与推理

指向性音视频分割中的全模态表达与推理

Kaining Ying, Henghui Ding, Guanquan Jie, et al.

基于弱监督的无人机影像未见域车辆检测器自适应方法

基于弱监督的无人机影像未见域车辆检测器自适应方法

Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.

VL-Cogito：面向高级多模态推理的渐进式课程强化学习

VL-Cogito：面向高级多模态推理的渐进式课程强化学习

Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.

Falcon-H1：一类混合头语言模型，重新定义效率与性能

Falcon-H1：一类混合头语言模型，重新定义效率与性能

Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.

BANG：通过生成式爆炸动力学划分3D资产

BANG：通过生成式爆炸动力学划分3D资产

Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.

ScreenCoder：通过模块化多模态Agent推进前端自动化中的视觉到代码生成

ScreenCoder：通过模块化多模态Agent推进前端自动化中的视觉到代码生成

Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.

MIRepNet：一种基于EEG的运动想象分类的流水线与基础模型

MIRepNet：一种基于EEG的运动想象分类的流水线与基础模型

卷积神经网络

Dingkun Liu, Zhu Chen, Jingwei Luo, et al.

ChemDFM-R：一种融合原子化化学知识的化学推理LLM

ChemDFM-R：一种融合原子化化学知识的化学推理LLM

Zihan Zhao, Bo Chen, Ziping Wan, et al.

X-Omni：强化学习让离散自回归图像生成模型重放光彩

X-Omni：强化学习让离散自回归图像生成模型重放光彩

Zigang Geng, Yibing Wang, Yeyao Ma, et al.

HunyuanWorld 1.0：从文本或像素生成沉浸式、可探索且可交互的3D世界

HunyuanWorld 1.0：从文本或像素生成沉浸式、可探索且可交互的3D世界

HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.

AlphaEarth Foundations：一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型

AlphaEarth Foundations：一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

基于可解释深度学习模型的长时序ENSO预测

基于可解释深度学习模型的长时序ENSO预测

卷积神经网络

Qi Chen, Yinghao Cui, Guobin Hong, et al.

OmniArch：面向科学计算的基础模型构建

OmniArch：面向科学计算的基础模型构建

Tianyu Chen, Haoyi Zhou, Ying Li, et al.

UI-AGILE：通过有效的强化学习和精确的推理期对齐推进GUI代理

UI-AGILE：通过有效的强化学习和精确的推理期对齐推进GUI代理

监督式微调

Shuquan Lian, Yuhang Wu, Jia Ma, et al.

DualSG：一种双流显式语义引导的多变量时间序列预测框架

DualSG：一种双流显式语义引导的多变量时间序列预测框架

自然语言处理

Kuiye Ding, Fanda Fan, Yao Wang, et al.

当 Tokens 讲得太多：跨图像、视频和音频的多模态长上下文 Tokens 压缩综述

当 Tokens 讲得太多：跨图像、视频和音频的多模态长上下文 Tokens 压缩综述

计算机视觉

Kele Shao, Keda Tao, Kejia Zhang, et al.

SmallThinker：一个为本地部署原生训练的高效大型语言模型家族

SmallThinker：一个为本地部署原生训练的高效大型语言模型家族

Yixin Song, Zhenliang Xue, Dongliang Wei, et al.

重建4D空间智能：一项综述

重建4D空间智能：一项综述

计算机视觉

Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.

Rep-MTL：释放表示层任务显著性在多任务学习中的潜力

Rep-MTL：释放表示层任务显著性在多任务学习中的潜力

多任务学习

Zedong Wang, Siyuan Li, Dan Xu

ARC-Hunyuan-Video-7B：现实世界短视频的结构化视频理解

ARC-Hunyuan-Video-7B：现实世界短视频的结构化视频理解

Yuying Ge, Yixiao Ge, Chen Li, et al.

Agent 强化策略优化

Agent 强化策略优化

Guanting Dong, Hangyu Mao, Kai Ma, et al.

SciToolAgent：一个基于知识图谱的科学Agent，用于多工具集成

SciToolAgent：一个基于知识图谱的科学Agent，用于多工具集成

检索增强生成

Keyan Ding, Jing Yu, Junjie Huang, et al.

规范自校正：通过测试时优化缓解上下文奖励黑客行为

规范自校正：通过测试时优化缓解上下文奖励黑客行为

Víctor Gallego

PRIX：从原始图像中学习规划用于端到端自动驾驶

PRIX：从原始图像中学习规划用于端到端自动驾驶

计算机视觉

Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.

与人工智能聊天：实时视频通信从人类到人工智能的意外转变

与人工智能聊天：实时视频通信从人类到人工智能的意外转变

Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.

MMBench-GUI：面向GUI代理的分层多平台评估框架

MMBench-GUI：面向GUI代理的分层多平台评估框架

Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.

深度研究者与测试时扩散

深度研究者与测试时扩散

检索增强生成

Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.

LLM量化几何：GPTQ作为Babai的最近平面算法

LLM量化几何：GPTQ作为Babai的最近平面算法

Jiale Chen, Torsten Hoefler, Dan Alistarh

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

Siyi Xun, Yue Sun, Jingkun Chen, et al.

OS-MAP: 计算机使用代理在广度和深度上能走多远？

OS-MAP: 计算机使用代理在广度和深度上能走多远？

Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.

分层预算策略优化用于自适应推理

分层预算策略优化用于自适应推理

Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.

思维链自指导：为推理与非推理任务构建高质量的合成提示

思维链自指导：为推理与非推理任务构建高质量的合成提示

Ping Yu, Jack Lanchantin, Tianlu Wang, et al.

指向性音视频分割中的全模态表达与推理

指向性音视频分割中的全模态表达与推理

Kaining Ying, Henghui Ding, Guanquan Jie, et al.

基于弱监督的无人机影像未见域车辆检测器自适应方法

基于弱监督的无人机影像未见域车辆检测器自适应方法

Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.

VL-Cogito：面向高级多模态推理的渐进式课程强化学习

VL-Cogito：面向高级多模态推理的渐进式课程强化学习

Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.

Falcon-H1：一类混合头语言模型，重新定义效率与性能

Falcon-H1：一类混合头语言模型，重新定义效率与性能

Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.

BANG：通过生成式爆炸动力学划分3D资产

BANG：通过生成式爆炸动力学划分3D资产

Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.

ScreenCoder：通过模块化多模态Agent推进前端自动化中的视觉到代码生成

ScreenCoder：通过模块化多模态Agent推进前端自动化中的视觉到代码生成

Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.

MIRepNet：一种基于EEG的运动想象分类的流水线与基础模型

MIRepNet：一种基于EEG的运动想象分类的流水线与基础模型

卷积神经网络

Dingkun Liu, Zhu Chen, Jingwei Luo, et al.

ChemDFM-R：一种融合原子化化学知识的化学推理LLM

ChemDFM-R：一种融合原子化化学知识的化学推理LLM

Zihan Zhao, Bo Chen, Ziping Wan, et al.

X-Omni：强化学习让离散自回归图像生成模型重放光彩

X-Omni：强化学习让离散自回归图像生成模型重放光彩

Zigang Geng, Yibing Wang, Yeyao Ma, et al.

HunyuanWorld 1.0：从文本或像素生成沉浸式、可探索且可交互的3D世界

HunyuanWorld 1.0：从文本或像素生成沉浸式、可探索且可交互的3D世界

HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.

AlphaEarth Foundations：一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型

AlphaEarth Foundations：一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

基于可解释深度学习模型的长时序ENSO预测

基于可解释深度学习模型的长时序ENSO预测

卷积神经网络

Qi Chen, Yinghao Cui, Guobin Hong, et al.

OmniArch：面向科学计算的基础模型构建

OmniArch：面向科学计算的基础模型构建

Tianyu Chen, Haoyi Zhou, Ying Li, et al.

UI-AGILE：通过有效的强化学习和精确的推理期对齐推进GUI代理

UI-AGILE：通过有效的强化学习和精确的推理期对齐推进GUI代理

监督式微调

Shuquan Lian, Yuhang Wu, Jia Ma, et al.

DualSG：一种双流显式语义引导的多变量时间序列预测框架

DualSG：一种双流显式语义引导的多变量时间序列预测框架

自然语言处理

Kuiye Ding, Fanda Fan, Yao Wang, et al.

当 Tokens 讲得太多：跨图像、视频和音频的多模态长上下文 Tokens 压缩综述

当 Tokens 讲得太多：跨图像、视频和音频的多模态长上下文 Tokens 压缩综述

计算机视觉

Kele Shao, Keda Tao, Kejia Zhang, et al.

SmallThinker：一个为本地部署原生训练的高效大型语言模型家族

SmallThinker：一个为本地部署原生训练的高效大型语言模型家族

Yixin Song, Zhenliang Xue, Dongliang Wei, et al.

重建4D空间智能：一项综述

重建4D空间智能：一项综述

计算机视觉

Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.

Rep-MTL：释放表示层任务显著性在多任务学习中的潜力

Rep-MTL：释放表示层任务显著性在多任务学习中的潜力

多任务学习

Zedong Wang, Siyuan Li, Dan Xu

ARC-Hunyuan-Video-7B：现实世界短视频的结构化视频理解

ARC-Hunyuan-Video-7B：现实世界短视频的结构化视频理解

Yuying Ge, Yixiao Ge, Chen Li, et al.

Agent 强化策略优化

Agent 强化策略优化

Guanting Dong, Hangyu Mao, Kai Ma, et al.

SciToolAgent：一个基于知识图谱的科学Agent，用于多工具集成

SciToolAgent：一个基于知识图谱的科学Agent，用于多工具集成

检索增强生成

Keyan Ding, Jing Yu, Junjie Huang, et al.

规范自校正：通过测试时优化缓解上下文奖励黑客行为

规范自校正：通过测试时优化缓解上下文奖励黑客行为

Víctor Gallego

PRIX：从原始图像中学习规划用于端到端自动驾驶

PRIX：从原始图像中学习规划用于端到端自动驾驶

计算机视觉

Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.

与人工智能聊天：实时视频通信从人类到人工智能的意外转变

与人工智能聊天：实时视频通信从人类到人工智能的意外转变

Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.

MMBench-GUI：面向GUI代理的分层多平台评估框架

MMBench-GUI：面向GUI代理的分层多平台评估框架

Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.

深度研究者与测试时扩散

深度研究者与测试时扩散

检索增强生成

Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.

LLM量化几何：GPTQ作为Babai的最近平面算法

LLM量化几何：GPTQ作为Babai的最近平面算法

Jiale Chen, Torsten Hoefler, Dan Alistarh

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

MedIQA：一种可扩展的基于提示的医学图像质量评估基础模型

Siyi Xun, Yue Sun, Jingkun Chen, et al.

OS-MAP: 计算机使用代理在广度和深度上能走多远？

OS-MAP: 计算机使用代理在广度和深度上能走多远？

Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.

分层预算策略优化用于自适应推理

分层预算策略优化用于自适应推理

Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.