HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
BlenderFusion:基于3D的视觉编辑与生成合成
扩散模型
图像分割
Chen, Jiacheng, Mehran, et al.
UniMate:一种统一的机械超材料生成、性能预测及条件确认模型
多模态
多任务学习
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
学习跳过Transformer的中间层
Transformer
LLM
Tim Lawson, Laurence Aitchison
SAM4D:在相机和激光雷达流中分割任何物体
语义分割
多模态
Jianyun Xu, Song Wang, Ziqian Ni, et al.
在大型语言模型预训练中如何找到“Grokking”?监测从记忆到泛化的转变而不使用测试集
深度学习
自然语言处理
Ziyue Li, Chenrui Fan, Tianyi Zhou
FineWeb2:一管通天下——适应每种语言的预训练数据处理
数据集
LLM
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
MADrive:增强记忆的驾驶场景建模
计算机视觉
自动驾驶
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
FaSTA^*:用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘
Agent
推理
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
Mind2Web 2:评估代理搜索中的代理作为评判者
Agent
检索增强生成
Boyu Gou, Zanming Huang, Yuting Ning, et al.
WorldVLA:迈向自回归动作世界模型
Transformer
图像理解
Jun Cen, Chaohui Yu, Hangjie Yuan, et al.
ReCode:利用强化学习更新代码API知识
代码生成
LLM
Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.
当生活给你样本:扩大多语言大模型推理计算的好处
LLM
多任务学习
Ammar Khairi, Daniel Dsouza, Ye Shen, et al.
HiWave:基于小波的扩散采样实现无训练高分辨率图像生成
扩散模型
图像生成
Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.
DualTHOR:一种用于应对意外情况规划的双臂类人机器人仿真平台
具身智能
机器人技术
Li, Boyu, He, et al.
MMSearch-R1:激励LMMs进行搜索
检索增强生成
视觉问答
Jinming Wu, Zihao Deng, Wei Li, et al.
OctoThinker:中期训练激励强化学习扩展
强化学习
模型训练
Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.
AlphaGenome:利用统一的DNA序列模型推进调控变异效应预测
AI for Science
深度学习
\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.
OmniDrive:一种包含反事实推理的自动驾驶综合视觉-语言数据集
自动驾驶
LLM
Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.
EcoMapper:面向气候的卫星影像生成建模
文生图
图像生成
Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.
JarvisArt:通过智能照片修缮代理解放人类艺术创造力
多模态
计算机视觉
Lin, Yunlong, Lin, et al.
ScaleCap:通过双模态去偏实现推理时可扩展的图像描述生成
图像描述
多模态
Long Xing, Qidong Huang, Xiaoyi Dong, et al.
GRPO-CARE:多模态推理中的一致性感知强化学习
强化学习
多模态
Chen, Yi, Ge, et al.
Skywork-SWE:揭示大型语言模型中软件工程的数据规模定律
代码生成
LLM
Liang Zeng, Yongcong Li, Yuzhen Xiao, et al.
矩阵游戏:互动世界基础模型
视频生成
图生视频
Yifan Zhang, Chunli Peng, Boyang Wang, et al.
AnimaX:使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果
扩散模型
3D 生成
Zehuan Huang, Haoran Feng, Yangtian Sun, et al.
基于学习的无人机高效视觉主动跟踪飞行目标方法
目标跟踪
目标检测
Jagadeswara PKV Pothuri, Aditya Bhatt, Prajit KrisshnaKumar, et al.
TritonZ:一种用于探索和救援作业的遥控水下漫游车带机械臂
机器人技术
计算机视觉
Kawser Ahmed, Mir Shahriar Fardin, Md Arif Faysal Nayem, et al.
ReasonFlux-PRM:轨迹感知的PRM用于LLM中的长链推理
监督式微调
偏好
Jiaru Zou, Ling Yang, Jingwen Gu, et al.
Phantom-Data:面向通用主题一致的视频生成数据集
文生视频
图生视频
Zhuowei Chen, Bingchuan Li, Tianxiang Ma, et al.
RLPR:将RLVR外推至无需验证器的一般领域
基准
推理
Tianyu Yu, Bo Ji, Shouli Wang, et al.
LongWriter-Zero:通过强化学习掌握超长文本生成
LLM
文本生成
Yuhao Wu, Yushi Bai, Zhiqiang Hu, et al.
法线之光:通用光度立体的统一特征表示
计算机视觉
图像理解
Hong Li, Houyuan Chen, Chongjie Ye, et al.
1
42
43
44
45
46
47
48
BlenderFusion:基于3D的视觉编辑与生成合成
扩散模型
图像分割
Chen, Jiacheng, Mehran, et al.
UniMate:一种统一的机械超材料生成、性能预测及条件确认模型
多模态
多任务学习
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
学习跳过Transformer的中间层
Transformer
LLM
Tim Lawson, Laurence Aitchison
SAM4D:在相机和激光雷达流中分割任何物体
语义分割
多模态
Jianyun Xu, Song Wang, Ziqian Ni, et al.
在大型语言模型预训练中如何找到“Grokking”?监测从记忆到泛化的转变而不使用测试集
深度学习
自然语言处理
Ziyue Li, Chenrui Fan, Tianyi Zhou
FineWeb2:一管通天下——适应每种语言的预训练数据处理
数据集
LLM
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
MADrive:增强记忆的驾驶场景建模
计算机视觉
自动驾驶
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
FaSTA^*:用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘
Agent
推理
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
Mind2Web 2:评估代理搜索中的代理作为评判者
Agent
检索增强生成
Boyu Gou, Zanming Huang, Yuting Ning, et al.
WorldVLA:迈向自回归动作世界模型
Transformer
图像理解
Jun Cen, Chaohui Yu, Hangjie Yuan, et al.
ReCode:利用强化学习更新代码API知识
代码生成
LLM
Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.
当生活给你样本:扩大多语言大模型推理计算的好处
LLM
多任务学习
Ammar Khairi, Daniel Dsouza, Ye Shen, et al.
HiWave:基于小波的扩散采样实现无训练高分辨率图像生成
扩散模型
图像生成
Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.
DualTHOR:一种用于应对意外情况规划的双臂类人机器人仿真平台
具身智能
机器人技术
Li, Boyu, He, et al.
MMSearch-R1:激励LMMs进行搜索
检索增强生成
视觉问答
Jinming Wu, Zihao Deng, Wei Li, et al.
OctoThinker:中期训练激励强化学习扩展
强化学习
模型训练
Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.
AlphaGenome:利用统一的DNA序列模型推进调控变异效应预测
AI for Science
深度学习
\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.
OmniDrive:一种包含反事实推理的自动驾驶综合视觉-语言数据集
自动驾驶
LLM
Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.
EcoMapper:面向气候的卫星影像生成建模
文生图
图像生成
Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.
JarvisArt:通过智能照片修缮代理解放人类艺术创造力
多模态
计算机视觉
Lin, Yunlong, Lin, et al.
ScaleCap:通过双模态去偏实现推理时可扩展的图像描述生成
图像描述
多模态
Long Xing, Qidong Huang, Xiaoyi Dong, et al.
GRPO-CARE:多模态推理中的一致性感知强化学习
强化学习
多模态
Chen, Yi, Ge, et al.
Skywork-SWE:揭示大型语言模型中软件工程的数据规模定律
代码生成
LLM
Liang Zeng, Yongcong Li, Yuzhen Xiao, et al.
矩阵游戏:互动世界基础模型
视频生成
图生视频
Yifan Zhang, Chunli Peng, Boyang Wang, et al.
AnimaX:使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果
扩散模型
3D 生成
Zehuan Huang, Haoran Feng, Yangtian Sun, et al.
基于学习的无人机高效视觉主动跟踪飞行目标方法
目标跟踪
目标检测
Jagadeswara PKV Pothuri, Aditya Bhatt, Prajit KrisshnaKumar, et al.
TritonZ:一种用于探索和救援作业的遥控水下漫游车带机械臂
机器人技术
计算机视觉
Kawser Ahmed, Mir Shahriar Fardin, Md Arif Faysal Nayem, et al.
ReasonFlux-PRM:轨迹感知的PRM用于LLM中的长链推理
监督式微调
偏好
Jiaru Zou, Ling Yang, Jingwen Gu, et al.
Phantom-Data:面向通用主题一致的视频生成数据集
文生视频
图生视频
Zhuowei Chen, Bingchuan Li, Tianxiang Ma, et al.
RLPR:将RLVR外推至无需验证器的一般领域
基准
推理
Tianyu Yu, Bo Ji, Shouli Wang, et al.
LongWriter-Zero:通过强化学习掌握超长文本生成
LLM
文本生成
Yuhao Wu, Yushi Bai, Zhiqiang Hu, et al.
法线之光:通用光度立体的统一特征表示
计算机视觉
图像理解
Hong Li, Houyuan Chen, Chongjie Ye, et al.
1
42
43
44
45
46
47
48