HyperAI超神经

文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会

关于服务条款隐私政策
中文

HyperAI超神经

Command Palette

Search for a command to run...

首页
论文

论文

每日更新的前沿 AI 研究论文，助您把握人工智能最新动向

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集帮助

产品

资讯教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI超神经

津ICP备17010941号-1

京公网安备11010502038810号

Discord X (formerly Twitter)Bilibili

HyperAI超神经

文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会

关于服务条款隐私政策
中文

HyperAI超神经

Command Palette

Search for a command to run...

首页
论文

论文

每日更新的前沿 AI 研究论文，助您把握人工智能最新动向

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集帮助

产品

资讯教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI超神经

津ICP备17010941号-1

京公网安备11010502038810号

Discord X (formerly Twitter)Bilibili

论文 | HyperAI超神经

在大型语言模型预训练中如何找到“Grokking”？监测从记忆到泛化的转变而不使用测试集

在大型语言模型预训练中如何找到“Grokking”？监测从记忆到泛化的转变而不使用测试集

Ziyue Li, Chenrui Fan, Tianyi Zhou

FineWeb2：一管通天下——适应每种语言的预训练数据处理

FineWeb2：一管通天下——适应每种语言的预训练数据处理

Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.

MADrive：增强记忆的驾驶场景建模

MADrive：增强记忆的驾驶场景建模

Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.

FaSTA^*：用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘

FaSTA^*：用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘

Advait Gupta, Rishie Raj, Dang Nguyen, et al.

Mind2Web 2：评估代理搜索中的代理作为评判者

Mind2Web 2：评估代理搜索中的代理作为评判者

Boyu Gou, Zanming Huang, Yuting Ning, et al.

WorldVLA：迈向自回归动作世界模型

WorldVLA：迈向自回归动作世界模型

Jun Cen, Chaohui Yu, Hangjie Yuan, et al.

ReCode：利用强化学习更新代码API知识

ReCode：利用强化学习更新代码API知识

Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.

当生活给你样本：扩大多语言大模型推理计算的好处

当生活给你样本：扩大多语言大模型推理计算的好处

Ammar Khairi, Daniel Dsouza, Ye Shen, et al.

HiWave：基于小波的扩散采样实现无训练高分辨率图像生成

HiWave：基于小波的扩散采样实现无训练高分辨率图像生成

Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.

DualTHOR：一种用于应对意外情况规划的双臂类人机器人仿真平台

DualTHOR：一种用于应对意外情况规划的双臂类人机器人仿真平台

Li, Boyu, He, et al.

MMSearch-R1：激励LMMs进行搜索

MMSearch-R1：激励LMMs进行搜索

Jinming Wu, Zihao Deng, Wei Li, et al.

OctoThinker：中期训练激励强化学习扩展

OctoThinker：中期训练激励强化学习扩展

Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.

AlphaGenome：利用统一的DNA序列模型推进调控变异效应预测

AlphaGenome：利用统一的DNA序列模型推进调控变异效应预测

\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.

OmniDrive：一种包含反事实推理的自动驾驶综合视觉-语言数据集

OmniDrive：一种包含反事实推理的自动驾驶综合视觉-语言数据集

Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.

EcoMapper：面向气候的卫星影像生成建模

EcoMapper：面向气候的卫星影像生成建模

Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.

JarvisArt：通过智能照片修缮代理解放人类艺术创造力

JarvisArt：通过智能照片修缮代理解放人类艺术创造力

Lin, Yunlong, Lin, et al.

ScaleCap：通过双模态去偏实现推理时可扩展的图像描述生成

ScaleCap：通过双模态去偏实现推理时可扩展的图像描述生成

Long Xing, Qidong Huang, Xiaoyi Dong, et al.

GRPO-CARE：多模态推理中的一致性感知强化学习

GRPO-CARE：多模态推理中的一致性感知强化学习

Chen, Yi, Ge, et al.

Skywork-SWE：揭示大型语言模型中软件工程的数据规模定律

Skywork-SWE：揭示大型语言模型中软件工程的数据规模定律

Liang Zeng, Yongcong Li, Yuzhen Xiao, et al.

矩阵游戏：互动世界基础模型

矩阵游戏：互动世界基础模型

Yifan Zhang, Chunli Peng, Boyang Wang, et al.

AnimaX：使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果

AnimaX：使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果

Zehuan Huang, Haoran Feng, Yangtian Sun, et al.

基于学习的无人机高效视觉主动跟踪飞行目标方法

基于学习的无人机高效视觉主动跟踪飞行目标方法

Jagadeswara PKV Pothuri, Aditya Bhatt, Prajit KrisshnaKumar, et al.

TritonZ：一种用于探索和救援作业的遥控水下漫游车带机械臂

TritonZ：一种用于探索和救援作业的遥控水下漫游车带机械臂

Kawser Ahmed, Mir Shahriar Fardin, Md Arif Faysal Nayem, et al.

ReasonFlux-PRM：轨迹感知的PRM用于LLM中的长链推理

ReasonFlux-PRM：轨迹感知的PRM用于LLM中的长链推理

Jiaru Zou, Ling Yang, Jingwen Gu, et al.

Phantom-Data：面向通用主题一致的视频生成数据集

Phantom-Data：面向通用主题一致的视频生成数据集

Zhuowei Chen, Bingchuan Li, Tianxiang Ma, et al.

RLPR：将RLVR外推至无需验证器的一般领域

RLPR：将RLVR外推至无需验证器的一般领域

Tianyu Yu, Bo Ji, Shouli Wang, et al.

LongWriter-Zero：通过强化学习掌握超长文本生成

LongWriter-Zero：通过强化学习掌握超长文本生成

Yuhao Wu, Yushi Bai, Zhiqiang Hu, et al.

OmniGen2：探索高级多模态生成

OmniGen2：探索高级多模态生成

Chenyuan Wu, Pengfei Zheng, Ruiran Yan, et al.

法线之光：通用光度立体的统一特征表示

法线之光：通用光度立体的统一特征表示

Hong Li, Houyuan Chen, Chongjie Ye, et al.

利用STATE预测细胞在不同环境下对扰动的反应

利用STATE预测细胞在不同环境下对扰动的反应

Abhinav K. Adduri, Dhruv Gautam, Beatrice Bevilacqua, et al.

CodeDiffuser：通过VLM生成的代码增强注意力扩散策略以解决指令模糊性

CodeDiffuser：通过VLM生成的代码增强注意力扩散策略以解决指令模糊性

Guang Yin, Yitong Li, Yixuan Wang, et al.

优化多语言文本转语音技术以包含口音和情感

优化多语言文本转语音技术以包含口音和情感

Pawar, Pranav, Dwivedi, et al.

在大型语言模型预训练中如何找到“Grokking”？监测从记忆到泛化的转变而不使用测试集

在大型语言模型预训练中如何找到“Grokking”？监测从记忆到泛化的转变而不使用测试集

Ziyue Li, Chenrui Fan, Tianyi Zhou

FineWeb2：一管通天下——适应每种语言的预训练数据处理

FineWeb2：一管通天下——适应每种语言的预训练数据处理

Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.

MADrive：增强记忆的驾驶场景建模

MADrive：增强记忆的驾驶场景建模

Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.

FaSTA^*：用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘

FaSTA^*：用于高效多轮图像编辑的快速-慢速刀具路径代理与子程序挖掘

Advait Gupta, Rishie Raj, Dang Nguyen, et al.

Mind2Web 2：评估代理搜索中的代理作为评判者

Mind2Web 2：评估代理搜索中的代理作为评判者

Boyu Gou, Zanming Huang, Yuting Ning, et al.

WorldVLA：迈向自回归动作世界模型

WorldVLA：迈向自回归动作世界模型

Jun Cen, Chaohui Yu, Hangjie Yuan, et al.

ReCode：利用强化学习更新代码API知识

ReCode：利用强化学习更新代码API知识

Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.

当生活给你样本：扩大多语言大模型推理计算的好处

当生活给你样本：扩大多语言大模型推理计算的好处

Ammar Khairi, Daniel Dsouza, Ye Shen, et al.

HiWave：基于小波的扩散采样实现无训练高分辨率图像生成

HiWave：基于小波的扩散采样实现无训练高分辨率图像生成

Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.

DualTHOR：一种用于应对意外情况规划的双臂类人机器人仿真平台

DualTHOR：一种用于应对意外情况规划的双臂类人机器人仿真平台

Li, Boyu, He, et al.

MMSearch-R1：激励LMMs进行搜索

MMSearch-R1：激励LMMs进行搜索

Jinming Wu, Zihao Deng, Wei Li, et al.

OctoThinker：中期训练激励强化学习扩展

OctoThinker：中期训练激励强化学习扩展

Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.

AlphaGenome：利用统一的DNA序列模型推进调控变异效应预测

AlphaGenome：利用统一的DNA序列模型推进调控变异效应预测

\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.

OmniDrive：一种包含反事实推理的自动驾驶综合视觉-语言数据集

OmniDrive：一种包含反事实推理的自动驾驶综合视觉-语言数据集

Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.

EcoMapper：面向气候的卫星影像生成建模

EcoMapper：面向气候的卫星影像生成建模

Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.

JarvisArt：通过智能照片修缮代理解放人类艺术创造力

JarvisArt：通过智能照片修缮代理解放人类艺术创造力

Lin, Yunlong, Lin, et al.

ScaleCap：通过双模态去偏实现推理时可扩展的图像描述生成

ScaleCap：通过双模态去偏实现推理时可扩展的图像描述生成

Long Xing, Qidong Huang, Xiaoyi Dong, et al.

GRPO-CARE：多模态推理中的一致性感知强化学习

GRPO-CARE：多模态推理中的一致性感知强化学习

Chen, Yi, Ge, et al.

Skywork-SWE：揭示大型语言模型中软件工程的数据规模定律

Skywork-SWE：揭示大型语言模型中软件工程的数据规模定律

Liang Zeng, Yongcong Li, Yuzhen Xiao, et al.

矩阵游戏：互动世界基础模型

矩阵游戏：互动世界基础模型

Yifan Zhang, Chunli Peng, Boyang Wang, et al.

AnimaX：使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果

AnimaX：使用联合视频-姿态扩散模型在3D中赋予无生命物体以动画效果

Zehuan Huang, Haoran Feng, Yangtian Sun, et al.

基于学习的无人机高效视觉主动跟踪飞行目标方法

基于学习的无人机高效视觉主动跟踪飞行目标方法

Jagadeswara PKV Pothuri, Aditya Bhatt, Prajit KrisshnaKumar, et al.

TritonZ：一种用于探索和救援作业的遥控水下漫游车带机械臂

TritonZ：一种用于探索和救援作业的遥控水下漫游车带机械臂

Kawser Ahmed, Mir Shahriar Fardin, Md Arif Faysal Nayem, et al.

ReasonFlux-PRM：轨迹感知的PRM用于LLM中的长链推理

ReasonFlux-PRM：轨迹感知的PRM用于LLM中的长链推理

Jiaru Zou, Ling Yang, Jingwen Gu, et al.

Phantom-Data：面向通用主题一致的视频生成数据集

Phantom-Data：面向通用主题一致的视频生成数据集

Zhuowei Chen, Bingchuan Li, Tianxiang Ma, et al.

RLPR：将RLVR外推至无需验证器的一般领域

RLPR：将RLVR外推至无需验证器的一般领域

Tianyu Yu, Bo Ji, Shouli Wang, et al.

LongWriter-Zero：通过强化学习掌握超长文本生成

LongWriter-Zero：通过强化学习掌握超长文本生成

Yuhao Wu, Yushi Bai, Zhiqiang Hu, et al.

OmniGen2：探索高级多模态生成

OmniGen2：探索高级多模态生成

Chenyuan Wu, Pengfei Zheng, Ruiran Yan, et al.

法线之光：通用光度立体的统一特征表示

法线之光：通用光度立体的统一特征表示

Hong Li, Houyuan Chen, Chongjie Ye, et al.

利用STATE预测细胞在不同环境下对扰动的反应

利用STATE预测细胞在不同环境下对扰动的反应

Abhinav K. Adduri, Dhruv Gautam, Beatrice Bevilacqua, et al.

CodeDiffuser：通过VLM生成的代码增强注意力扩散策略以解决指令模糊性

CodeDiffuser：通过VLM生成的代码增强注意力扩散策略以解决指令模糊性

Guang Yin, Yitong Li, Yixuan Wang, et al.

优化多语言文本转语音技术以包含口音和情感

优化多语言文本转语音技术以包含口音和情感

Pawar, Pranav, Dwivedi, et al.