HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

教LLM进行规划：用于符号规划的逻辑思维链指令微调

教LLM进行规划：用于符号规划的逻辑思维链指令微调

监督式微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

OpenHA：一系列开源的Minecraft层级化Agent模型

OpenHA：一系列开源的Minecraft层级化Agent模型

统一多模态

多任务学习

Zihao Wang, Muyao Li, Kaichen He, et al.

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

ReSum：通过上下文摘要解锁长时程搜索智能

ReSum：通过上下文摘要解锁长时程搜索智能

Xixi Wu, Kuan Li, Yida Zhao, et al.

WebResearcher：在长时程Agent中释放无边界推理能力

WebResearcher：在长时程Agent中释放无边界推理能力

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

通过环境扩展迈向通用Agent智能

通过环境扩展迈向通用Agent智能

Runnan Fang, Shihao Cai, Baixuan Li, et al.

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

通过持续预训练扩展Agent

通过持续预训练扩展Agent

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

检索增强生成

Zijian Li, Xin Guan, Bo Zhang, et al.

大型语言模型中的Glitch Tokens：分类体系与有效检测

大型语言模型中的Glitch Tokens：分类体系与有效检测

Yuxi Li, Yi Liu, Gelei Deng, et al.

REFRAG：重新思考基于RAG的解码

REFRAG：重新思考基于RAG的解码

检索增强生成

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

统一多模态

多任务学习

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

上下文混合用于长视频生成

上下文混合用于长视频生成

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

MusicSwarm：用于音乐创作的生物启发式智能

MusicSwarm：用于音乐创作的生物启发式智能

Markus J. Buehler

LEGO：张量应用的时空加速器生成与优化

LEGO：张量应用的时空加速器生成与优化

Yujun Lin, Zhekai Zhang, Song Han

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

Zixin Yin, Xili Dai, Duomin Wang, et al.

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

监督式微调

检索增强生成

Iman Barati, Mostafa Amiri, Heshaam Faili

可解释的物理推理与视觉-语言模型的性能分类体系

可解释的物理推理与视觉-语言模型的性能分类体系

Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.

InternScenes：一个大规模可模拟室内场景数据集，具备真实布局

InternScenes：一个大规模可模拟室内场景数据集，具备真实布局

Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.

UI-S1：通过半在线强化学习推进GUI自动化

UI-S1：通过半在线强化学习推进GUI自动化

Zhengxi Lu, Jiabo Ye, Fei Tang, et al.

OmniWorld：用于4D世界建模的多领域多模态数据集

OmniWorld：用于4D世界建模的多领域多模态数据集

Yang Zhou, Yifan Wang, Jianjun Zhou, et al.

LAVa：基于层级的KV缓存淘汰与动态预算分配

LAVa：基于层级的KV缓存淘汰与动态预算分配

Yiqun Shen, Song Yuan, Zhengze Zhang, et al.

基于概率结构融合的世界建模

基于概率结构融合的世界建模

Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.

VStyle：一个基于口语指令的语音风格适配基准

VStyle：一个基于口语指令的语音风格适配基准

统一多模态

Jun Zhan, Mingyang Han, Yuxuan Xie, et al.

HANRAG：启发式高精度抗噪声多跳问答增强生成

HANRAG：启发式高精度抗噪声多跳问答增强生成

检索增强生成

Duolin Sun, Dan Yang, Yue Shen, et al.

InfGen：一种与分辨率无关的可扩展图像合成范式

InfGen：一种与分辨率无关的可扩展图像合成范式

Tao Han, Wanghan Xu, Junchao Gong, et al.

X-Part：高保真且结构一致的形状分解

X-Part：高保真且结构一致的形状分解

Xinhao Yan, Jiachen Xu, Yang Li, et al.

收益递减的错觉：LLM中长时 horizon 执行的度量

收益递减的错觉：LLM中长时 horizon 执行的度量

Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.

IntrEx：用于建模教育对话中参与度的数据集

IntrEx：用于建模教育对话中参与度的数据集

Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.

Youtu-GraphRAG：面向图检索增强型复杂推理的垂直统一Agent

Youtu-GraphRAG：面向图检索增强型复杂推理的垂直统一Agent

检索增强生成

Junnan Dong, Siyu An, Yifei Yu, et al.

SceneSplat：基于视觉-语言预训练的高斯点云场景理解

SceneSplat：基于视觉-语言预训练的高斯点云场景理解

机器视觉 3D

多模态表征

Yue Li, Qi Ma, Runyi Yang, et al.

教LLM进行规划：用于符号规划的逻辑思维链指令微调

教LLM进行规划：用于符号规划的逻辑思维链指令微调

监督式微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

OpenHA：一系列开源的Minecraft层级化Agent模型

OpenHA：一系列开源的Minecraft层级化Agent模型

统一多模态

多任务学习

Zihao Wang, Muyao Li, Kaichen He, et al.

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

ReSum：通过上下文摘要解锁长时程搜索智能

ReSum：通过上下文摘要解锁长时程搜索智能

Xixi Wu, Kuan Li, Yida Zhao, et al.

WebResearcher：在长时程Agent中释放无边界推理能力

WebResearcher：在长时程Agent中释放无边界推理能力

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

通过环境扩展迈向通用Agent智能

通过环境扩展迈向通用Agent智能

Runnan Fang, Shihao Cai, Baixuan Li, et al.

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

通过持续预训练扩展Agent

通过持续预训练扩展Agent

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

检索增强生成

Zijian Li, Xin Guan, Bo Zhang, et al.

大型语言模型中的Glitch Tokens：分类体系与有效检测

大型语言模型中的Glitch Tokens：分类体系与有效检测

Yuxi Li, Yi Liu, Gelei Deng, et al.

REFRAG：重新思考基于RAG的解码

REFRAG：重新思考基于RAG的解码

检索增强生成

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

统一多模态

多任务学习

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

上下文混合用于长视频生成

上下文混合用于长视频生成

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

MusicSwarm：用于音乐创作的生物启发式智能

MusicSwarm：用于音乐创作的生物启发式智能

Markus J. Buehler

LEGO：张量应用的时空加速器生成与优化

LEGO：张量应用的时空加速器生成与优化

Yujun Lin, Zhekai Zhang, Song Han

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

Zixin Yin, Xili Dai, Duomin Wang, et al.

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

监督式微调

检索增强生成

Iman Barati, Mostafa Amiri, Heshaam Faili

可解释的物理推理与视觉-语言模型的性能分类体系

可解释的物理推理与视觉-语言模型的性能分类体系

Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.

InternScenes：一个大规模可模拟室内场景数据集，具备真实布局

InternScenes：一个大规模可模拟室内场景数据集，具备真实布局

Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.

UI-S1：通过半在线强化学习推进GUI自动化

UI-S1：通过半在线强化学习推进GUI自动化

Zhengxi Lu, Jiabo Ye, Fei Tang, et al.

OmniWorld：用于4D世界建模的多领域多模态数据集

OmniWorld：用于4D世界建模的多领域多模态数据集

Yang Zhou, Yifan Wang, Jianjun Zhou, et al.

LAVa：基于层级的KV缓存淘汰与动态预算分配

LAVa：基于层级的KV缓存淘汰与动态预算分配

Yiqun Shen, Song Yuan, Zhengze Zhang, et al.

基于概率结构融合的世界建模

基于概率结构融合的世界建模

Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.

VStyle：一个基于口语指令的语音风格适配基准

VStyle：一个基于口语指令的语音风格适配基准

统一多模态

Jun Zhan, Mingyang Han, Yuxuan Xie, et al.

HANRAG：启发式高精度抗噪声多跳问答增强生成

HANRAG：启发式高精度抗噪声多跳问答增强生成

检索增强生成

Duolin Sun, Dan Yang, Yue Shen, et al.

InfGen：一种与分辨率无关的可扩展图像合成范式

InfGen：一种与分辨率无关的可扩展图像合成范式

Tao Han, Wanghan Xu, Junchao Gong, et al.

X-Part：高保真且结构一致的形状分解

X-Part：高保真且结构一致的形状分解

Xinhao Yan, Jiachen Xu, Yang Li, et al.

收益递减的错觉：LLM中长时 horizon 执行的度量

收益递减的错觉：LLM中长时 horizon 执行的度量

Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.

IntrEx：用于建模教育对话中参与度的数据集

IntrEx：用于建模教育对话中参与度的数据集

Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.

Youtu-GraphRAG：面向图检索增强型复杂推理的垂直统一Agent

Youtu-GraphRAG：面向图检索增强型复杂推理的垂直统一Agent

检索增强生成

Junnan Dong, Siyu An, Yifei Yu, et al.

SceneSplat：基于视觉-语言预训练的高斯点云场景理解

SceneSplat：基于视觉-语言预训练的高斯点云场景理解

机器视觉 3D

多模态表征

Yue Li, Qi Ma, Runyi Yang, et al.