HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

解锁隐性经验：从文本中合成工具使用轨迹

解锁隐性经验：从文本中合成工具使用轨迹

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

你的组相对优势存在偏差

你的组相对优势存在偏差

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

STEM：通过嵌入模块扩展Transformer

STEM：通过嵌入模块扩展Transformer

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

迷失在噪声中：推理模型在上下文干扰项下的失效机制

迷失在噪声中：推理模型在上下文干扰项下的失效机制

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

超越静态工具：面向科学推理的测试时工具演化

超越静态工具：面向科学推理的测试时工具演化

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

VIBE：基于视觉指令的编辑器

VIBE：基于视觉指令的编辑器

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

协作式多Agent测试时强化学习用于推理

协作式多Agent测试时强化学习用于推理

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

基于视觉-语言推理的城市社会语义分割

基于视觉-语言推理的城市社会语义分割

Yu Wang, Yi Wang, Rui Dai, et al.

STEP3-VL-10B 技术报告

STEP3-VL-10B 技术报告

多模态表征

Ailin Huang, Chengyuan Yao, Chunrui Han, et al.

SeedFold：扩展生物分子结构预测

SeedFold：扩展生物分子结构预测

Yi Zhou, Chan Lu, Yiming Ma, et al.

TranslateGemma 技术报告

TranslateGemma 技术报告

Mara Finkelstein, Isaac Caswell, Tobias Domhan, et al.

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

机器人技术

Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

Lijun Liu, Linwei Chen, Zhishou Zhang, et al.

A^3-Bench：通过锚点与吸引子激活进行内存驱动型科学推理的基准测试

A^3-Bench：通过锚点与吸引子激活进行内存驱动型科学推理的基准测试

Jian Zhang, Yu He, Zhiyuan Wang, et al.

算法代码优化的受控自演化

算法代码优化的受控自演化

Tu Hu, Ronghao Chen, Shuo Zhang, et al.

MAXS：基于LLM Agent的元自适应探索

MAXS：基于LLM Agent的元自适应探索

Jian Zhang, Zhiyuan Wang, Zhangqi Wang, et al.

DeepResearchEval：一种用于深度研究任务构建与代理评估的自动化框架

DeepResearchEval：一种用于深度研究任务构建与代理评估的自动化框架

Yibo Wang, Lei Wang, Yue Deng, et al.

0型映射到旗流形空间的动机类

0型映射到旗流形空间的动机类

Jim Bryan, Balázs Elek, Freddie Manners, et al.

UniversalRAG：面向多模态与多粒度语料库的检索增强生成

UniversalRAG：面向多模态与多粒度语料库的检索增强生成

检索增强生成

多模态表征

Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, et al.

对齐文本、代码与视觉：一种用于文本到可视化生成的多目标强化学习框架

对齐文本、代码与视觉：一种用于文本到可视化生成的多目标强化学习框架

Mizanur Rahman, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, et al.

大语言模型在持续预训练过程中如何学习概念？

大语言模型在持续预训练过程中如何学习概念？

Barry Menglong Yao, Sha Li, Yunzhi Yao, et al.

JudgeRLVR：先判断，后生成，实现高效推理

JudgeRLVR：先判断，后生成，实现高效推理

Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.

SnapGen++：释放扩散Transformer在边缘设备上高效高保真图像生成的潜力

SnapGen++：释放扩散Transformer在边缘设备上高效高保真图像生成的潜力

Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.

视频生成中的运动归因

视频生成中的运动归因

Xindi Wu, Despoina Paschalidou, Jun Gao, et al.

Ministral 3

Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.

置信度二分法：工具使用Agent中误校准问题的分析与缓解

置信度二分法：工具使用Agent中误校准问题的分析与缓解

Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.

ArenaRL：通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展

ArenaRL：通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展

Qiang Zhang, Boli Chen, Fanrui Zhang, et al.

ShowUI-π：基于流的生成模型作为GUI灵巧手

ShowUI-π：基于流的生成模型作为GUI灵巧手

Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou

在野外学习潜在动作世界模型

在野外学习潜在动作世界模型

Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.

Dr. Zero：无需训练数据的自演化搜索Agent

Dr. Zero：无需训练数据的自演化搜索Agent

Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.

解锁隐性经验：从文本中合成工具使用轨迹

解锁隐性经验：从文本中合成工具使用轨迹

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

你的组相对优势存在偏差

你的组相对优势存在偏差

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

STEM：通过嵌入模块扩展Transformer

STEM：通过嵌入模块扩展Transformer

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

迷失在噪声中：推理模型在上下文干扰项下的失效机制

迷失在噪声中：推理模型在上下文干扰项下的失效机制

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

超越静态工具：面向科学推理的测试时工具演化

超越静态工具：面向科学推理的测试时工具演化

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

VIBE：基于视觉指令的编辑器

VIBE：基于视觉指令的编辑器

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

协作式多Agent测试时强化学习用于推理

协作式多Agent测试时强化学习用于推理

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

基于视觉-语言推理的城市社会语义分割

基于视觉-语言推理的城市社会语义分割

Yu Wang, Yi Wang, Rui Dai, et al.

STEP3-VL-10B 技术报告

STEP3-VL-10B 技术报告

多模态表征

Ailin Huang, Chengyuan Yao, Chunrui Han, et al.

SeedFold：扩展生物分子结构预测

SeedFold：扩展生物分子结构预测

Yi Zhou, Chan Lu, Yiming Ma, et al.

TranslateGemma 技术报告

TranslateGemma 技术报告

Mara Finkelstein, Isaac Caswell, Tobias Domhan, et al.

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

机器人技术

Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

Lijun Liu, Linwei Chen, Zhishou Zhang, et al.

A^3-Bench：通过锚点与吸引子激活进行内存驱动型科学推理的基准测试

A^3-Bench：通过锚点与吸引子激活进行内存驱动型科学推理的基准测试

Jian Zhang, Yu He, Zhiyuan Wang, et al.

算法代码优化的受控自演化

算法代码优化的受控自演化

Tu Hu, Ronghao Chen, Shuo Zhang, et al.

MAXS：基于LLM Agent的元自适应探索

MAXS：基于LLM Agent的元自适应探索

Jian Zhang, Zhiyuan Wang, Zhangqi Wang, et al.

DeepResearchEval：一种用于深度研究任务构建与代理评估的自动化框架

DeepResearchEval：一种用于深度研究任务构建与代理评估的自动化框架

Yibo Wang, Lei Wang, Yue Deng, et al.

0型映射到旗流形空间的动机类

0型映射到旗流形空间的动机类

Jim Bryan, Balázs Elek, Freddie Manners, et al.

UniversalRAG：面向多模态与多粒度语料库的检索增强生成

UniversalRAG：面向多模态与多粒度语料库的检索增强生成

检索增强生成

多模态表征

Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, et al.

对齐文本、代码与视觉：一种用于文本到可视化生成的多目标强化学习框架

对齐文本、代码与视觉：一种用于文本到可视化生成的多目标强化学习框架

Mizanur Rahman, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, et al.

大语言模型在持续预训练过程中如何学习概念？

大语言模型在持续预训练过程中如何学习概念？

Barry Menglong Yao, Sha Li, Yunzhi Yao, et al.

JudgeRLVR：先判断，后生成，实现高效推理

JudgeRLVR：先判断，后生成，实现高效推理

Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.

SnapGen++：释放扩散Transformer在边缘设备上高效高保真图像生成的潜力

SnapGen++：释放扩散Transformer在边缘设备上高效高保真图像生成的潜力

Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.

视频生成中的运动归因

视频生成中的运动归因

Xindi Wu, Despoina Paschalidou, Jun Gao, et al.

Ministral 3

Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.

置信度二分法：工具使用Agent中误校准问题的分析与缓解

置信度二分法：工具使用Agent中误校准问题的分析与缓解

Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.

ArenaRL：通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展

ArenaRL：通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展

Qiang Zhang, Boli Chen, Fanrui Zhang, et al.

ShowUI-π：基于流的生成模型作为GUI灵巧手

ShowUI-π：基于流的生成模型作为GUI灵巧手

Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou

在野外学习潜在动作世界模型

在野外学习潜在动作世界模型

Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.

Dr. Zero：无需训练数据的自演化搜索Agent

Dr. Zero：无需训练数据的自演化搜索Agent

Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.