HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
教LLM进行规划:用于符号规划的逻辑思维链指令微调
LLM
监督式微调
Pulkit Verma, Ngoc La, Anthony Favier, et al.
OpenHA:一系列开源的Minecraft层级化Agent模型
统一多模态
多任务学习
Zihao Wang, Muyao Li, Kaichen He, et al.
BED-LLM:基于LLM与贝叶斯实验设计的智能信息收集
LLM
Agent
Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.
ReSum:通过上下文摘要解锁长时程搜索智能
Agent
推理
Xixi Wu, Kuan Li, Yida Zhao, et al.
WebResearcher:在长时程Agent中释放无边界推理能力
Agent
推理
Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.
通过环境扩展迈向通用Agent智能
Agent
LLM
Runnan Fang, Shihao Cai, Baixuan Li, et al.
WebSailor-V2:通过合成数据与可扩展强化学习弥合专有Agent的鸿沟
Agent
强化学习
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
通过持续预训练扩展Agent
Agent
LLM
Liangcai Su, Zhen Zhang, Guangyu Li, et al.
WebWeaver:通过动态大纲构建网络规模证据以支持开放式深度研究
检索增强生成
Agent
Zijian Li, Xin Guan, Bo Zhang, et al.
大型语言模型中的Glitch Tokens:分类体系与有效检测
LLM
Transformer
Yuxi Li, Yi Liu, Gelei Deng, et al.
REFRAG:重新思考基于RAG的解码
检索增强生成
LLM
Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.
对齐后引导:通过统一潜在引导适应视觉-语言-动作模型
统一多模态
多任务学习
Yang Zhang, Chenwei Wang, Ouyang Lu, et al.
SubLIME:基于秩相关性预测的子集选择用于数据高效的LLM评估
LLM
数据集
Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.
上下文混合用于长视频生成
视频生成
Transformer
Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.
MusicSwarm:用于音乐创作的生物启发式智能
深度学习
建模
Markus J. Buehler
LEGO:张量应用的时空加速器生成与优化
AI 编译器
LLM
Yujun Lin, Zhekai Zhang, Song Han
LazyDrag:通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑
扩散模型
多模态
Zixin Yin, Xili Dai, Duomin Wang, et al.
SearchInstruct:通过基于检索的指令数据集构建增强领域自适应
监督式微调
检索增强生成
Iman Barati, Mostafa Amiri, Heshaam Faili
可解释的物理推理与视觉-语言模型的性能分类体系
多模态
推理
Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.
InternScenes:一个大规模可模拟室内场景数据集,具备真实布局
3D 模型
数据集
Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.
UI-S1:通过半在线强化学习推进GUI自动化
强化学习
Agent
Zhengxi Lu, Jiabo Ye, Fei Tang, et al.
OmniWorld:用于4D世界建模的多领域多模态数据集
数据集
视频理解
Yang Zhou, Yifan Wang, Jianjun Zhou, et al.
LAVa:基于层级的KV缓存淘汰与动态预算分配
LLM
Transformer
Yiqun Shen, Song Yuan, Zhengze Zhang, et al.
基于概率结构融合的世界建模
建模
视频理解
Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.
VStyle:一个基于口语指令的语音风格适配基准
语音生成
统一多模态
Jun Zhan, Mingyang Han, Yuxuan Xie, et al.
HANRAG:启发式高精度抗噪声多跳问答增强生成
检索增强生成
LLM
Duolin Sun, Dan Yang, Yue Shen, et al.
InfGen:一种与分辨率无关的可扩展图像合成范式
扩散模型
图像生成
Tao Han, Wanghan Xu, Junchao Gong, et al.
X-Part:高保真且结构一致的形状分解
3D 生成
语义分割
Xinhao Yan, Jiachen Xu, Yang Li, et al.
收益递减的错觉:LLM中长时 horizon 执行的度量
LLM
推理
Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.
IntrEx:用于建模教育对话中参与度的数据集
数据集
LLM
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.
Youtu-GraphRAG:面向图检索增强型复杂推理的垂直统一Agent
检索增强生成
LLM
Junnan Dong, Siyu An, Yifei Yu, et al.
SceneSplat:基于视觉-语言预训练的高斯点云场景理解
机器视觉 3D
多模态表征
Yue Li, Qi Ma, Runyi Yang, et al.
1
26
27
28
29
30
31
32
48
教LLM进行规划:用于符号规划的逻辑思维链指令微调
LLM
监督式微调
Pulkit Verma, Ngoc La, Anthony Favier, et al.
OpenHA:一系列开源的Minecraft层级化Agent模型
统一多模态
多任务学习
Zihao Wang, Muyao Li, Kaichen He, et al.
BED-LLM:基于LLM与贝叶斯实验设计的智能信息收集
LLM
Agent
Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.
ReSum:通过上下文摘要解锁长时程搜索智能
Agent
推理
Xixi Wu, Kuan Li, Yida Zhao, et al.
WebResearcher:在长时程Agent中释放无边界推理能力
Agent
推理
Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.
通过环境扩展迈向通用Agent智能
Agent
LLM
Runnan Fang, Shihao Cai, Baixuan Li, et al.
WebSailor-V2:通过合成数据与可扩展强化学习弥合专有Agent的鸿沟
Agent
强化学习
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
通过持续预训练扩展Agent
Agent
LLM
Liangcai Su, Zhen Zhang, Guangyu Li, et al.
WebWeaver:通过动态大纲构建网络规模证据以支持开放式深度研究
检索增强生成
Agent
Zijian Li, Xin Guan, Bo Zhang, et al.
大型语言模型中的Glitch Tokens:分类体系与有效检测
LLM
Transformer
Yuxi Li, Yi Liu, Gelei Deng, et al.
REFRAG:重新思考基于RAG的解码
检索增强生成
LLM
Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.
对齐后引导:通过统一潜在引导适应视觉-语言-动作模型
统一多模态
多任务学习
Yang Zhang, Chenwei Wang, Ouyang Lu, et al.
SubLIME:基于秩相关性预测的子集选择用于数据高效的LLM评估
LLM
数据集
Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.
上下文混合用于长视频生成
视频生成
Transformer
Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.
MusicSwarm:用于音乐创作的生物启发式智能
深度学习
建模
Markus J. Buehler
LEGO:张量应用的时空加速器生成与优化
AI 编译器
LLM
Yujun Lin, Zhekai Zhang, Song Han
LazyDrag:通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑
扩散模型
多模态
Zixin Yin, Xili Dai, Duomin Wang, et al.
SearchInstruct:通过基于检索的指令数据集构建增强领域自适应
监督式微调
检索增强生成
Iman Barati, Mostafa Amiri, Heshaam Faili
可解释的物理推理与视觉-语言模型的性能分类体系
多模态
推理
Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.
InternScenes:一个大规模可模拟室内场景数据集,具备真实布局
3D 模型
数据集
Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.
UI-S1:通过半在线强化学习推进GUI自动化
强化学习
Agent
Zhengxi Lu, Jiabo Ye, Fei Tang, et al.
OmniWorld:用于4D世界建模的多领域多模态数据集
数据集
视频理解
Yang Zhou, Yifan Wang, Jianjun Zhou, et al.
LAVa:基于层级的KV缓存淘汰与动态预算分配
LLM
Transformer
Yiqun Shen, Song Yuan, Zhengze Zhang, et al.
基于概率结构融合的世界建模
建模
视频理解
Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.
VStyle:一个基于口语指令的语音风格适配基准
语音生成
统一多模态
Jun Zhan, Mingyang Han, Yuxuan Xie, et al.
HANRAG:启发式高精度抗噪声多跳问答增强生成
检索增强生成
LLM
Duolin Sun, Dan Yang, Yue Shen, et al.
InfGen:一种与分辨率无关的可扩展图像合成范式
扩散模型
图像生成
Tao Han, Wanghan Xu, Junchao Gong, et al.
X-Part:高保真且结构一致的形状分解
3D 生成
语义分割
Xinhao Yan, Jiachen Xu, Yang Li, et al.
收益递减的错觉:LLM中长时 horizon 执行的度量
LLM
推理
Akshit Sinha, Arvindh Arun, Shashwat Goel, et al.
IntrEx:用于建模教育对话中参与度的数据集
数据集
LLM
Xingwei Tan, Mahathi Parvatham, Chiara Gambi, et al.
Youtu-GraphRAG:面向图检索增强型复杂推理的垂直统一Agent
检索增强生成
LLM
Junnan Dong, Siyu An, Yifei Yu, et al.
SceneSplat:基于视觉-语言预训练的高斯点云场景理解
机器视觉 3D
多模态表征
Yue Li, Qi Ma, Runyi Yang, et al.
1
26
27
28
29
30
31
32
48