HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

Ming-UniVision：基于统一连续Tokenizer的联合图像理解与生成

Ming-UniVision：基于统一连续Tokenizer的联合图像理解与生成

Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.

Phi-3 技术报告：一款可在您的手机上本地运行的高性能语言模型

Phi-3 技术报告：一款可在您的手机上本地运行的高性能语言模型

Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.

Qwen2.5 技术报告

Qwen2.5 技术报告

监督式微调

Qwen, An Yang, Baosong Yang, et al.

通过引入深度研究增强AlphaEvolve实现科学算法发现

通过引入深度研究增强AlphaEvolve实现科学算法发现

Gang Liu, Yihan Zhu, Jie Chen, et al.

ConstraintLLM：一种面向工业级约束编程的神经符号框架

ConstraintLLM：一种面向工业级约束编程的神经符号框架

监督式微调

Weichun Shi, Minghao Liu, Wanting Zhang, et al.

代码辅助思维链与指令的扩展用于模型推理

代码辅助思维链与指令的扩展用于模型推理

Honglin Lin, Qizhi Pei, Xin Gao, et al.

CoDA：通过扩散适应进行编码LM

CoDA：通过扩散适应进行编码LM

Haolin Chen, Shiyu Wang, Can Qin, et al.

Fast-dLLM v2：高效块扩散LLM

Fast-dLLM v2：高效块扩散LLM

Chengyue Wu, Hao Zhang, Shuchen Xue, et al.

少即是多：使用小型网络进行递归推理

少即是多：使用小型网络进行递归推理

Alexia Jolicoeur-Martineau

Fathom-DeepResearch：解锁长时程信息检索与综合以赋能SLMs

Fathom-DeepResearch：解锁长时程信息检索与综合以赋能SLMs

Shreyas Singh, Kunal Singh, Pradeep Moturi

TaTToo：面向表格推理中测试时扩展的工具基础思维PRM

TaTToo：面向表格推理中测试时扩展的工具基础思维PRM

监督式微调

Jiaru Zou, Soumya Roy, Vinay Kumar Verma, et al.

语言模型的混合架构：系统性分析与设计洞察

语言模型的混合架构：系统性分析与设计洞察

Sangmin Bae, Bilge Acun, Haroun Habeeb, et al.

MITS：通过点互信息增强LLM的树搜索推理

MITS：通过点互信息增强LLM的树搜索推理

Jiaxi Li, Yucheng Shi, Jin Lu, et al.

对大型语言模型的不可察觉的越狱攻击

对大型语言模型的不可察觉的越狱攻击

Kuofeng Gao, Yiming Li, Chao Du, et al.

VChain：用于视频生成推理的视觉思维链

VChain：用于视频生成推理的视觉思维链

Ziqi Huang, Ning Yu, Gordon Chen, et al.

视频-LMM后训练：基于大型多模态模型的视频推理深度探究

视频-LMM后训练：基于大型多模态模型的视频推理深度探究

监督式微调

Yunlong Tang, Jing Bi, Pinxin Liu, et al.

Paper2Video：从科学论文自动生成视频

Paper2Video：从科学论文自动生成视频

统一多模态

Zeyu Zhu, Kevin Qinghong Lin, Mike Zheng Shou

微缩扩展FP4量化中的承诺与性能之间的差距

微缩扩展FP4量化中的承诺与性能之间的差距

Vage Egiazarian, Roberto L. Castro, Denis Kuznedelev, et al.

多模态大语言模型中的自提升：一项综述

多模态大语言模型中的自提升：一项综述

Shijian Deng, Kai Wang, Tianyu Yang, et al.

通过测试时分布级组合改进基于扩散或基于流的机器人策略

通过测试时分布级组合改进基于扩散或基于流的机器人策略

机器人技术

Jiahang Cao, Yize Huang, Hanzhong Guo, et al.

大型推理模型从有缺陷的思维中学习到更好的对齐

大型推理模型从有缺陷的思维中学习到更好的对齐

ShengYun Peng, Eric Smith, Ivan Evtimov, et al.

通过渐进一致性蒸馏实现高效的多模态大型语言模型

通过渐进一致性蒸馏实现高效的多模态大型语言模型

Zichen Wen, Shaobo Wang, Yufa Zhou, et al.

Apriel-1.5-15b-Thinker

Apriel-1.5-15b-Thinker

Shruthan Radhakrishna, Aman Tiwari, Aanjaneya Shukla, et al.

StockBench：LLM Agent 能否在现实市场中盈利地交易股票？

StockBench：LLM Agent 能否在现实市场中盈利地交易股票？

Yanxu Chen, Zijun Yao, Yantao Liu, et al.

交互式训练：反馈驱动的神经网络优化

交互式训练：反馈驱动的神经网络优化

Wentao Zhang, Yang Young Lu, Yuntian Deng

StealthAttack：通过密度引导的幻觉实现鲁棒的3D Gaussian Splatting投毒

StealthAttack：通过密度引导的幻觉实现鲁棒的3D Gaussian Splatting投毒

机器视觉 3D

Bo-Hsu Ke, You-Zhe Xie, Yu-Lun Liu, et al.

ExGRPO：从经验中学习推理

ExGRPO：从经验中学习推理

Runzhe Zhan, Yafu Li, Zhi Wang, et al.

Self-Forcing++：迈向分钟级高质量视频生成

Self-Forcing++：迈向分钟级高质量视频生成

Justin Cui, Jie Wu, Ming Li, et al.

LongCodeZip：为Code LLM压缩长上下文

LongCodeZip：为Code LLM压缩长上下文

Yuling Shi, Yichun Qian, Hongyu Zhang, et al.

PIPer：通过在线强化学习实现设备端环境配置

PIPer：通过在线强化学习实现设备端环境配置

监督式微调

Alexander Kovrigin, Aleksandra Eliseeva, Konstantin Grotov, et al.

多领域测试时扩展的奖励模型再思考

多领域测试时扩展的奖励模型再思考

监督式微调

Dong Bok Lee, Seanie Lee, Sangwoo Park, et al.

背包强化学习：通过优化预算分配解锁LLM的探索能力

背包强化学习：通过优化预算分配解锁LLM的探索能力

Ziniu Li, Congliang Chen, Tianyun Yang, et al.

Ming-UniVision：基于统一连续Tokenizer的联合图像理解与生成

Ming-UniVision：基于统一连续Tokenizer的联合图像理解与生成

Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.

Phi-3 技术报告：一款可在您的手机上本地运行的高性能语言模型

Phi-3 技术报告：一款可在您的手机上本地运行的高性能语言模型

Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.

Qwen2.5 技术报告

Qwen2.5 技术报告

监督式微调

Qwen, An Yang, Baosong Yang, et al.

通过引入深度研究增强AlphaEvolve实现科学算法发现

通过引入深度研究增强AlphaEvolve实现科学算法发现

Gang Liu, Yihan Zhu, Jie Chen, et al.

ConstraintLLM：一种面向工业级约束编程的神经符号框架

ConstraintLLM：一种面向工业级约束编程的神经符号框架

监督式微调

Weichun Shi, Minghao Liu, Wanting Zhang, et al.

代码辅助思维链与指令的扩展用于模型推理

代码辅助思维链与指令的扩展用于模型推理

Honglin Lin, Qizhi Pei, Xin Gao, et al.

CoDA：通过扩散适应进行编码LM

CoDA：通过扩散适应进行编码LM

Haolin Chen, Shiyu Wang, Can Qin, et al.

Fast-dLLM v2：高效块扩散LLM

Fast-dLLM v2：高效块扩散LLM

Chengyue Wu, Hao Zhang, Shuchen Xue, et al.

少即是多：使用小型网络进行递归推理

少即是多：使用小型网络进行递归推理

Alexia Jolicoeur-Martineau

Fathom-DeepResearch：解锁长时程信息检索与综合以赋能SLMs

Fathom-DeepResearch：解锁长时程信息检索与综合以赋能SLMs

Shreyas Singh, Kunal Singh, Pradeep Moturi

TaTToo：面向表格推理中测试时扩展的工具基础思维PRM

TaTToo：面向表格推理中测试时扩展的工具基础思维PRM

监督式微调

Jiaru Zou, Soumya Roy, Vinay Kumar Verma, et al.

语言模型的混合架构：系统性分析与设计洞察

语言模型的混合架构：系统性分析与设计洞察

Sangmin Bae, Bilge Acun, Haroun Habeeb, et al.

MITS：通过点互信息增强LLM的树搜索推理

MITS：通过点互信息增强LLM的树搜索推理

Jiaxi Li, Yucheng Shi, Jin Lu, et al.

对大型语言模型的不可察觉的越狱攻击

对大型语言模型的不可察觉的越狱攻击

Kuofeng Gao, Yiming Li, Chao Du, et al.

VChain：用于视频生成推理的视觉思维链

VChain：用于视频生成推理的视觉思维链

Ziqi Huang, Ning Yu, Gordon Chen, et al.

视频-LMM后训练：基于大型多模态模型的视频推理深度探究

视频-LMM后训练：基于大型多模态模型的视频推理深度探究

监督式微调

Yunlong Tang, Jing Bi, Pinxin Liu, et al.

Paper2Video：从科学论文自动生成视频

Paper2Video：从科学论文自动生成视频

统一多模态

Zeyu Zhu, Kevin Qinghong Lin, Mike Zheng Shou

微缩扩展FP4量化中的承诺与性能之间的差距

微缩扩展FP4量化中的承诺与性能之间的差距

Vage Egiazarian, Roberto L. Castro, Denis Kuznedelev, et al.

多模态大语言模型中的自提升：一项综述

多模态大语言模型中的自提升：一项综述

Shijian Deng, Kai Wang, Tianyu Yang, et al.

通过测试时分布级组合改进基于扩散或基于流的机器人策略

通过测试时分布级组合改进基于扩散或基于流的机器人策略

机器人技术

Jiahang Cao, Yize Huang, Hanzhong Guo, et al.

大型推理模型从有缺陷的思维中学习到更好的对齐

大型推理模型从有缺陷的思维中学习到更好的对齐

ShengYun Peng, Eric Smith, Ivan Evtimov, et al.

通过渐进一致性蒸馏实现高效的多模态大型语言模型

通过渐进一致性蒸馏实现高效的多模态大型语言模型

Zichen Wen, Shaobo Wang, Yufa Zhou, et al.

Apriel-1.5-15b-Thinker

Apriel-1.5-15b-Thinker

Shruthan Radhakrishna, Aman Tiwari, Aanjaneya Shukla, et al.

StockBench：LLM Agent 能否在现实市场中盈利地交易股票？

StockBench：LLM Agent 能否在现实市场中盈利地交易股票？

Yanxu Chen, Zijun Yao, Yantao Liu, et al.

交互式训练：反馈驱动的神经网络优化

交互式训练：反馈驱动的神经网络优化

Wentao Zhang, Yang Young Lu, Yuntian Deng

StealthAttack：通过密度引导的幻觉实现鲁棒的3D Gaussian Splatting投毒

StealthAttack：通过密度引导的幻觉实现鲁棒的3D Gaussian Splatting投毒

机器视觉 3D

Bo-Hsu Ke, You-Zhe Xie, Yu-Lun Liu, et al.

ExGRPO：从经验中学习推理

ExGRPO：从经验中学习推理

Runzhe Zhan, Yafu Li, Zhi Wang, et al.

Self-Forcing++：迈向分钟级高质量视频生成

Self-Forcing++：迈向分钟级高质量视频生成

Justin Cui, Jie Wu, Ming Li, et al.

LongCodeZip：为Code LLM压缩长上下文

LongCodeZip：为Code LLM压缩长上下文

Yuling Shi, Yichun Qian, Hongyu Zhang, et al.

PIPer：通过在线强化学习实现设备端环境配置

PIPer：通过在线强化学习实现设备端环境配置

监督式微调

Alexander Kovrigin, Aleksandra Eliseeva, Konstantin Grotov, et al.

多领域测试时扩展的奖励模型再思考

多领域测试时扩展的奖励模型再思考

监督式微调

Dong Bok Lee, Seanie Lee, Sangwoo Park, et al.

背包强化学习：通过优化预算分配解锁LLM的探索能力

背包强化学习：通过优化预算分配解锁LLM的探索能力

Ziniu Li, Congliang Chen, Tianyun Yang, et al.