HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
思维链自指导:为推理与非推理任务构建高质量的合成提示
LLM
推理
Ping Yu, Jack Lanchantin, Tianlu Wang, et al.
指向性音视频分割中的全模态表达与推理
多模态
视频理解
Kaining Ying, Henghui Ding, Guanquan Jie, et al.
基于弱监督的无人机影像未见域车辆检测器自适应方法
目标检测
遥感
Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.
VL-Cogito:面向高级多模态推理的渐进式课程强化学习
强化学习
推理
Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.
Falcon-H1:一类混合头语言模型,重新定义效率与性能
LLM
Transformer
Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.
BANG:通过生成式爆炸动力学划分3D资产
3D 生成
3D 模型
Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.
ScreenCoder:通过模块化多模态Agent推进前端自动化中的视觉到代码生成
代码生成
多模态
Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.
MIRepNet:一种基于EEG的运动想象分类的流水线与基础模型
深度学习
卷积神经网络
Dingkun Liu, Zhu Chen, Jingwei Luo, et al.
ChemDFM-R:一种融合原子化化学知识的化学推理LLM
LLM
推理
Zihan Zhao, Bo Chen, Ziping Wan, et al.
X-Omni:强化学习让离散自回归图像生成模型重放光彩
图像生成
扩散模型
Zigang Geng, Yibing Wang, Yeyao Ma, et al.
HunyuanWorld 1.0:从文本或像素生成沉浸式、可探索且可交互的3D世界
3D 生成
3D 模型
HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.
AlphaEarth Foundations:一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型
AI for Science
遥感
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
基于可解释深度学习模型的长时序ENSO预测
深度学习
卷积神经网络
Qi Chen, Yinghao Cui, Guobin Hong, et al.
OmniArch:面向科学计算的基础模型构建
AI for Science
Transformer
Tianyu Chen, Haoyi Zhou, Ying Li, et al.
UI-AGILE:通过有效的强化学习和精确的推理期对齐推进GUI代理
监督式微调
多模态
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
DualSG:一种双流显式语义引导的多变量时间序列预测框架
LLM
自然语言处理
Kuiye Ding, Fanda Fan, Yao Wang, et al.
当 Tokens 讲得太多:跨图像、视频和音频的多模态长上下文 Tokens 压缩综述
Transformer
计算机视觉
Kele Shao, Keda Tao, Kejia Zhang, et al.
SmallThinker:一个为本地部署原生训练的高效大型语言模型家族
LLM
Transformer
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
重建4D空间智能:一项综述
计算机视觉
视频理解
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
Rep-MTL:释放表示层任务显著性在多任务学习中的潜力
多任务学习
神经网络
Zedong Wang, Siyuan Li, Dan Xu
ARC-Hunyuan-Video-7B:现实世界短视频的结构化视频理解
视频理解
视频描述
Yuying Ge, Yixiao Ge, Chen Li, et al.
Agent 强化策略优化
强化学习
Agent
Guanting Dong, Hangyu Mao, Kai Ma, et al.
SciToolAgent:一个基于知识图谱的科学Agent,用于多工具集成
检索增强生成
LLM
Keyan Ding, Jing Yu, Junjie Huang, et al.
规范自校正:通过测试时优化缓解上下文奖励黑客行为
LLM
DeepSeek
Víctor Gallego
PRIX:从原始图像中学习规划用于端到端自动驾驶
自动驾驶
计算机视觉
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
与人工智能聊天:实时视频通信从人类到人工智能的意外转变
多模态
视频理解
Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.
MMBench-GUI:面向GUI代理的分层多平台评估框架
基准
Agent
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
深度研究者与测试时扩散
检索增强生成
推理
Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.
LLM量化几何:GPTQ作为Babai的最近平面算法
LLM
算法
Jiale Chen, Torsten Hoefler, Dan Alistarh
MedIQA:一种可扩展的基于提示的医学图像质量评估基础模型
医学影像
多模态
Siyi Xun, Yue Sun, Jingkun Chen, et al.
OS-MAP: 计算机使用代理在广度和深度上能走多远?
Agent
基准
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
分层预算策略优化用于自适应推理
强化学习
LLM
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
1
36
37
38
39
40
41
42
48
思维链自指导:为推理与非推理任务构建高质量的合成提示
LLM
推理
Ping Yu, Jack Lanchantin, Tianlu Wang, et al.
指向性音视频分割中的全模态表达与推理
多模态
视频理解
Kaining Ying, Henghui Ding, Guanquan Jie, et al.
基于弱监督的无人机影像未见域车辆检测器自适应方法
目标检测
遥感
Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.
VL-Cogito:面向高级多模态推理的渐进式课程强化学习
强化学习
推理
Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.
Falcon-H1:一类混合头语言模型,重新定义效率与性能
LLM
Transformer
Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.
BANG:通过生成式爆炸动力学划分3D资产
3D 生成
3D 模型
Longwen Zhang, Qixuan Zhang, Haoran Jiang, et al.
ScreenCoder:通过模块化多模态Agent推进前端自动化中的视觉到代码生成
代码生成
多模态
Yilei Jiang, Yaozhi Zheng, Yuxuan Wan, et al.
MIRepNet:一种基于EEG的运动想象分类的流水线与基础模型
深度学习
卷积神经网络
Dingkun Liu, Zhu Chen, Jingwei Luo, et al.
ChemDFM-R:一种融合原子化化学知识的化学推理LLM
LLM
推理
Zihan Zhao, Bo Chen, Ziping Wan, et al.
X-Omni:强化学习让离散自回归图像生成模型重放光彩
图像生成
扩散模型
Zigang Geng, Yibing Wang, Yeyao Ma, et al.
HunyuanWorld 1.0:从文本或像素生成沉浸式、可探索且可交互的3D世界
3D 生成
3D 模型
HunyuanWorld Team, Zhenwei Wang, Yuhao Liu, et al.
AlphaEarth Foundations:一种基于稀疏标签数据的准确高效全球地图构建嵌入场模型
AI for Science
遥感
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
基于可解释深度学习模型的长时序ENSO预测
深度学习
卷积神经网络
Qi Chen, Yinghao Cui, Guobin Hong, et al.
OmniArch:面向科学计算的基础模型构建
AI for Science
Transformer
Tianyu Chen, Haoyi Zhou, Ying Li, et al.
UI-AGILE:通过有效的强化学习和精确的推理期对齐推进GUI代理
监督式微调
多模态
Shuquan Lian, Yuhang Wu, Jia Ma, et al.
DualSG:一种双流显式语义引导的多变量时间序列预测框架
LLM
自然语言处理
Kuiye Ding, Fanda Fan, Yao Wang, et al.
当 Tokens 讲得太多:跨图像、视频和音频的多模态长上下文 Tokens 压缩综述
Transformer
计算机视觉
Kele Shao, Keda Tao, Kejia Zhang, et al.
SmallThinker:一个为本地部署原生训练的高效大型语言模型家族
LLM
Transformer
Yixin Song, Zhenliang Xue, Dongliang Wei, et al.
重建4D空间智能:一项综述
计算机视觉
视频理解
Yukang Cao, Jiahao Lu, Zhisheng Huang, et al.
Rep-MTL:释放表示层任务显著性在多任务学习中的潜力
多任务学习
神经网络
Zedong Wang, Siyuan Li, Dan Xu
ARC-Hunyuan-Video-7B:现实世界短视频的结构化视频理解
视频理解
视频描述
Yuying Ge, Yixiao Ge, Chen Li, et al.
Agent 强化策略优化
强化学习
Agent
Guanting Dong, Hangyu Mao, Kai Ma, et al.
SciToolAgent:一个基于知识图谱的科学Agent,用于多工具集成
检索增强生成
LLM
Keyan Ding, Jing Yu, Junjie Huang, et al.
规范自校正:通过测试时优化缓解上下文奖励黑客行为
LLM
DeepSeek
Víctor Gallego
PRIX:从原始图像中学习规划用于端到端自动驾驶
自动驾驶
计算机视觉
Maciej K. Wozniak, Lianhang Liu, Yixi Cai, et al.
与人工智能聊天:实时视频通信从人类到人工智能的意外转变
多模态
视频理解
Jiangkai Wu, Zhiyuan Ren, Liming Liu, et al.
MMBench-GUI:面向GUI代理的分层多平台评估框架
基准
Agent
Xuehui Wang, Zhenyu Wu, JingJing Xie, et al.
深度研究者与测试时扩散
检索增强生成
推理
Rujun Han, Yanfei Chen, Zoey CuiZhu, et al.
LLM量化几何:GPTQ作为Babai的最近平面算法
LLM
算法
Jiale Chen, Torsten Hoefler, Dan Alistarh
MedIQA:一种可扩展的基于提示的医学图像质量评估基础模型
医学影像
多模态
Siyi Xun, Yue Sun, Jingkun Chen, et al.
OS-MAP: 计算机使用代理在广度和深度上能走多远?
Agent
基准
Xuetian Chen, Yinghao Chen, Xinfeng Yuan, et al.
分层预算策略优化用于自适应推理
强化学习
LLM
Shangke Lyu, Linjuan Wu, Yuchen Yan, et al.
1
36
37
38
39
40
41
42
48