HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

在野外学习潜在动作世界模型

在野外学习潜在动作世界模型

Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.

Dr. Zero：无需训练数据的自演化搜索Agent

Dr. Zero：无需训练数据的自演化搜索Agent

Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.

MHLA：通过Token级多头机制恢复线性注意力的表达能力

MHLA：通过Token级多头机制恢复线性注意力的表达能力

Kewei Zhang, Ye Huang, Yufan Deng, et al.

GlimpRouter：通过窥视一个思维token实现高效协同推理

GlimpRouter：通过窥视一个思维token实现高效协同推理

Wenhao Zeng, Xuteng Zhang, Yuling Shi, et al.

X-Coder：基于全合成任务、解法与测试的竞赛编程新范式

X-Coder：基于全合成任务、解法与测试的竞赛编程新范式

Jie Wu, Haoling Li, Xin Zhang, et al.

PaCoRe：通过并行协同推理学习在测试时扩展计算资源

PaCoRe：通过并行协同推理学习在测试时扩展计算资源

Jingcheng Hu, Yinmin Zhang, Shijie Shang, et al.

BabyVision：超越语言的视觉推理

BabyVision：超越语言的视觉推理

Liang Chen, Weichu Xie, Yiyan Liang, et al.

观看、推理与搜索：面向智能体视频推理的开放网络视频深度研究基准

观看、推理与搜索：面向智能体视频推理的开放网络视频深度研究基准

Chengwen Liu, Xiaomin Yu, Zhuoyue Chang, et al.

通过可扩展查找实现的条件记忆：大型语言模型稀疏性的一个新维度

通过可扩展查找实现的条件记忆：大型语言模型稀疏性的一个新维度

检索增强生成

Xin Cheng, Wangding Zeng, Damai Dai, et al.

EnvScaler：通过程序化合成实现LLM Agent的工具交互环境扩展

EnvScaler：通过程序化合成实现LLM Agent的工具交互环境扩展

Xiaoshuai Song, Haofei Chang, Guanting Dong, et al.

证据链构建：基于引用感知评分奖励的深度搜索Agent鲁棒强化学习

证据链构建：基于引用感知评分奖励的深度搜索Agent鲁棒强化学习

Jiajie Zhang, Xin Lv, Ling Feng, et al.

卡通化GS：基于高斯曲率的3D高斯溅射人脸夸张方法

卡通化GS：基于高斯曲率的3D高斯溅射人脸夸张方法

Eldad Matmon, Amit Bracha, Noam Rotstein, et al.

思维的分子结构：长链思维推理拓扑结构的映射

思维的分子结构：长链思维推理拓扑结构的映射

Qiguang Chen, Yantao Du, Ziniu Li, et al.

MMFormalizer：开放环境中的多模态自动形式化

MMFormalizer：开放环境中的多模态自动形式化

统一多模态

Jing Xiong, Qi Han, Yunta Hsieh, et al.

基于地图的思维：用于地理定位的强化并行地图增强型Agent

基于地图的思维：用于地理定位的强化并行地图增强型Agent

Yuxiang Ji, Yong Wang, Ziyu Ma, et al.

打破有向单源最短路径的排序障碍

打破有向单源最短路径的排序障碍

高性能计算

Ran Duan, Jiayi Mao, Xiao Mao, et al.

GR-Dexter 技术报告

GR-Dexter 技术报告

机器人技术

Ruoshi Wen, Guangzeng Chen, Zhongren Cui, et al.

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.

RelayLLM：通过协作解码实现高效推理

RelayLLM：通过协作解码实现高效推理

Chengsong Huang, Tong Zheng, Langlin Huang, et al.

基于FusionRoute的Token级LLM协作

基于FusionRoute的Token级LLM协作

Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.

可学习的缩放因子：释放语言模型矩阵层的规模限制

可学习的缩放因子：释放语言模型矩阵层的规模限制

Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

Shih-Yang Liu, Xin Dong, Ximing Lu, et al.

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.

从失败到精通：为Tool-use Agents生成困难样本

从失败到精通：为Tool-use Agents生成困难样本

Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.

编排一个动态物体的世界

编排一个动态物体的世界

Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.

Klear：统一的多任务音视频联合生成

Klear：统一的多任务音视频联合生成

统一多模态

Jun Wang, Chunyu Qiang, Yuxin Guo, et al.

Atlas：面向多领域复杂推理的异构模型与工具编排

Atlas：面向多领域复杂推理的异构模型与工具编排

Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.

Benchmark^2：LLM基准测试的系统性评估

Benchmark^2：LLM基准测试的系统性评估

Qi Qian, Chengsong Huang, Jingwen Xu, et al.

MindWatcher：迈向更智能的多模态工具融合推理

MindWatcher：迈向更智能的多模态工具融合推理

Jiawei Chen, Xintian Shen, Lihao Zheng, et al.

熵自适应微调：通过解决自信冲突以缓解遗忘

熵自适应微调：通过解决自信冲突以缓解遗忘

监督式微调

Muxi Diao, Lele Yang, Wuxuan Gong, et al.

多样性还是精确性？深入探究下一个token预测

多样性还是精确性？深入探究下一个token预测

监督式微调

Haoyuan Wu, Hai Wang, Jiajia Wu, et al.

在野外学习潜在动作世界模型

在野外学习潜在动作世界模型

Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.

Dr. Zero：无需训练数据的自演化搜索Agent

Dr. Zero：无需训练数据的自演化搜索Agent

Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.

MHLA：通过Token级多头机制恢复线性注意力的表达能力

MHLA：通过Token级多头机制恢复线性注意力的表达能力

Kewei Zhang, Ye Huang, Yufan Deng, et al.

GlimpRouter：通过窥视一个思维token实现高效协同推理

GlimpRouter：通过窥视一个思维token实现高效协同推理

Wenhao Zeng, Xuteng Zhang, Yuling Shi, et al.

X-Coder：基于全合成任务、解法与测试的竞赛编程新范式

X-Coder：基于全合成任务、解法与测试的竞赛编程新范式

Jie Wu, Haoling Li, Xin Zhang, et al.

PaCoRe：通过并行协同推理学习在测试时扩展计算资源

PaCoRe：通过并行协同推理学习在测试时扩展计算资源

Jingcheng Hu, Yinmin Zhang, Shijie Shang, et al.

BabyVision：超越语言的视觉推理

BabyVision：超越语言的视觉推理

Liang Chen, Weichu Xie, Yiyan Liang, et al.

观看、推理与搜索：面向智能体视频推理的开放网络视频深度研究基准

观看、推理与搜索：面向智能体视频推理的开放网络视频深度研究基准

Chengwen Liu, Xiaomin Yu, Zhuoyue Chang, et al.

通过可扩展查找实现的条件记忆：大型语言模型稀疏性的一个新维度

通过可扩展查找实现的条件记忆：大型语言模型稀疏性的一个新维度

检索增强生成

Xin Cheng, Wangding Zeng, Damai Dai, et al.

EnvScaler：通过程序化合成实现LLM Agent的工具交互环境扩展

EnvScaler：通过程序化合成实现LLM Agent的工具交互环境扩展

Xiaoshuai Song, Haofei Chang, Guanting Dong, et al.

证据链构建：基于引用感知评分奖励的深度搜索Agent鲁棒强化学习

证据链构建：基于引用感知评分奖励的深度搜索Agent鲁棒强化学习

Jiajie Zhang, Xin Lv, Ling Feng, et al.

卡通化GS：基于高斯曲率的3D高斯溅射人脸夸张方法

卡通化GS：基于高斯曲率的3D高斯溅射人脸夸张方法

Eldad Matmon, Amit Bracha, Noam Rotstein, et al.

思维的分子结构：长链思维推理拓扑结构的映射

思维的分子结构：长链思维推理拓扑结构的映射

Qiguang Chen, Yantao Du, Ziniu Li, et al.

MMFormalizer：开放环境中的多模态自动形式化

MMFormalizer：开放环境中的多模态自动形式化

统一多模态

Jing Xiong, Qi Han, Yunta Hsieh, et al.

基于地图的思维：用于地理定位的强化并行地图增强型Agent

基于地图的思维：用于地理定位的强化并行地图增强型Agent

Yuxiang Ji, Yong Wang, Ziyu Ma, et al.

打破有向单源最短路径的排序障碍

打破有向单源最短路径的排序障碍

高性能计算

Ran Duan, Jiayi Mao, Xiao Mao, et al.

GR-Dexter 技术报告

GR-Dexter 技术报告

机器人技术

Ruoshi Wen, Guangzeng Chen, Zhongren Cui, et al.

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

VideoAuto-R1：通过一次思考，两次作答实现视频自动推理

Shuming Liu, Mingchen Zhuge, Changsheng Zhao, et al.

RelayLLM：通过协作解码实现高效推理

RelayLLM：通过协作解码实现高效推理

Chengsong Huang, Tong Zheng, Langlin Huang, et al.

基于FusionRoute的Token级LLM协作

基于FusionRoute的Token级LLM协作

Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

RL-AWB：基于深度强化学习的低光照夜间场景自动白平衡校正

Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.

可学习的缩放因子：释放语言模型矩阵层的规模限制

可学习的缩放因子：释放语言模型矩阵层的规模限制

Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

GDPO：面向多奖励强化学习优化的分组奖励解耦归一化策略优化

Shih-Yang Liu, Xin Dong, Ximing Lu, et al.

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

MemRL：通过情景记忆上的运行时强化学习实现自我演化的Agent

Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.

从失败到精通：为Tool-use Agents生成困难样本

从失败到精通：为Tool-use Agents生成困难样本

Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.

编排一个动态物体的世界

编排一个动态物体的世界

Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.

Klear：统一的多任务音视频联合生成

Klear：统一的多任务音视频联合生成

统一多模态

Jun Wang, Chunyu Qiang, Yuxin Guo, et al.

Atlas：面向多领域复杂推理的异构模型与工具编排

Atlas：面向多领域复杂推理的异构模型与工具编排

Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.

Benchmark^2：LLM基准测试的系统性评估

Benchmark^2：LLM基准测试的系统性评估

Qi Qian, Chengsong Huang, Jingwen Xu, et al.

MindWatcher：迈向更智能的多模态工具融合推理

MindWatcher：迈向更智能的多模态工具融合推理

Jiawei Chen, Xintian Shen, Lihao Zheng, et al.

熵自适应微调：通过解决自信冲突以缓解遗忘

熵自适应微调：通过解决自信冲突以缓解遗忘

监督式微调

Muxi Diao, Lele Yang, Wuxuan Gong, et al.

多样性还是精确性？深入探究下一个token预测

多样性还是精确性？深入探究下一个token预测

监督式微调

Haoyuan Wu, Hai Wang, Jiajia Wu, et al.