HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
预算感知工具使用实现Agent的有效扩展
Agent
LLM
Tengxiao Liu, Zifeng Wang, Jin Miao, et al.
视频内指令:视觉信号作为生成控制
图生视频
视频生成
Gongfan Fang, Xinyin Ma, Xinchao Wang
DR Tulu:面向深度研究的基于演化评分标准的强化学习
强化学习
智能问答
Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.
AICC:精细化HTML解析,提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库
LLM
文档理解
Ren Ma, Jiantao Qiu, Chao Xu, et al.
UltraFlux:面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计
文生图
扩散模型
Tian Ye, Song Fei, Lei Zhu
DeCo:面向端到端图像生成的频率解耦像素扩散
扩散模型
图像生成
Zehong Ma, Longhui Wei, Shuai Wang, et al.
计算机操作 Agent 作为生成式用户界面的评判者
Agent
代码生成
Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.
AutoEnv:衡量 Agent 跨环境学习的自动化环境
强化学习
Agent
Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.
基于深度研究的通用 Agent 记忆
检索增强生成
Agent
B. Y. Yan, Chaofan Li, Hongjin Qian, et al.
VIRAL:面向人形机器人运动操作的规模化视觉仿真到现实迁移
强化学习
计算机视觉
Tairan He, Zi Wang, Haoru Xue, et al.
MIST:基于监督训练的互信息
神经网络
深度学习
German Gritsai, Megan Richards, Maxime Méloux, et al.
多Agent深度研究:基于M-GRPO训练多Agent系统
强化学习
Agent
Haoyang Hong, Jiajun Yin, Yuan Wang, et al.
无数据流程图提炼
扩散模型
合成
Shangyuan Tong, Nanye Ma, Saining Xie, et al.
HunyuanOCR 技术报告
OCR
视觉问答
Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.
PhysToolBench:面向MLLMs的物理工具理解能力评估
视觉问答
基准
Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.
赫胥黎-哥德尔机器:通过最优自改进机器的近似实现人类水平的编码Agent开发
Agent
人工智能
Wenyi Wang, Piotr Piękos, Li Nanbo, et al.
无需空间超感知的空间超感知求解
视频理解
计算机视觉
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:输出真实性的说服与认同鲁棒性评级——面向 LLMs 的阿谀鲁棒性基准
LLM
基准
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:面向个性化、长跨度及自进化 Agents 的全能记忆系统
LLM
基准
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
揭示文本本征维度:从学术摘要到创意故事
LLM
自然语言处理
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:基于概念的万物分割
计算机视觉
语义分割
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:面向地理定位的网络增强 Agent 视觉推理
Agent
检索增强生成
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
OpenMMReasoner:以开放与通用的方案拓展多模态推理的前沿
监督式微调
推理
Kaichen Zhang, Keming Wu, Zuhao Yang, et al.
HiPO:面向LLMs动态推理的混合策略优化
推理
强化学习
Ken Deng, Zizheng Zhan, Wen Xiang, et al.
SERES:基于语义感知的稀疏视角神经重建
3D 生成
计算机视觉
Bo Xu, Yuhu Guo, Yuchao Wang, et al.
SDAR:一种用于可扩展序列生成的协同扩散-自回归范式
扩散模型
模型训练
Shuang Cheng, Yihan Bian, Dawei Liu, et al.
MultiPL-MoE:通过混合专家模型扩展大型语言模型的多编程语言能力
LLM
代码生成
Qing Wang, Xue Han, Jiahui Wang, et al.
CapRL:通过强化学习激发密集图像描述能力
图像描述
视觉问答
Long Xing, Xiaoyi Dong, Yuhang Zang, et al.
通过离散扩散发散指令实现超快速语言生成
扩散模型
文本生成
Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.
DisCO:通过判别约束优化强化大型推理模型
强化学习
推理
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:面向低精度视觉-语言模型中统一查询-键-值权重压缩的高效低秩近似
Transformer
视觉问答
Yutong Wang, Haiyu Wang, Sai Qian Zhang
嵌套学习:深度学习架构的幻觉
深度学习
自然语言处理
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
1
12
13
14
15
16
17
18
48
预算感知工具使用实现Agent的有效扩展
Agent
LLM
Tengxiao Liu, Zifeng Wang, Jin Miao, et al.
视频内指令:视觉信号作为生成控制
图生视频
视频生成
Gongfan Fang, Xinyin Ma, Xinchao Wang
DR Tulu:面向深度研究的基于演化评分标准的强化学习
强化学习
智能问答
Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.
AICC:精细化HTML解析,提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库
LLM
文档理解
Ren Ma, Jiantao Qiu, Chao Xu, et al.
UltraFlux:面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计
文生图
扩散模型
Tian Ye, Song Fei, Lei Zhu
DeCo:面向端到端图像生成的频率解耦像素扩散
扩散模型
图像生成
Zehong Ma, Longhui Wei, Shuai Wang, et al.
计算机操作 Agent 作为生成式用户界面的评判者
Agent
代码生成
Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.
AutoEnv:衡量 Agent 跨环境学习的自动化环境
强化学习
Agent
Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.
基于深度研究的通用 Agent 记忆
检索增强生成
Agent
B. Y. Yan, Chaofan Li, Hongjin Qian, et al.
VIRAL:面向人形机器人运动操作的规模化视觉仿真到现实迁移
强化学习
计算机视觉
Tairan He, Zi Wang, Haoru Xue, et al.
MIST:基于监督训练的互信息
神经网络
深度学习
German Gritsai, Megan Richards, Maxime Méloux, et al.
多Agent深度研究:基于M-GRPO训练多Agent系统
强化学习
Agent
Haoyang Hong, Jiajun Yin, Yuan Wang, et al.
无数据流程图提炼
扩散模型
合成
Shangyuan Tong, Nanye Ma, Saining Xie, et al.
HunyuanOCR 技术报告
OCR
视觉问答
Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.
PhysToolBench:面向MLLMs的物理工具理解能力评估
视觉问答
基准
Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.
赫胥黎-哥德尔机器:通过最优自改进机器的近似实现人类水平的编码Agent开发
Agent
人工智能
Wenyi Wang, Piotr Piękos, Li Nanbo, et al.
无需空间超感知的空间超感知求解
视频理解
计算机视觉
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:输出真实性的说服与认同鲁棒性评级——面向 LLMs 的阿谀鲁棒性基准
LLM
基准
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:面向个性化、长跨度及自进化 Agents 的全能记忆系统
LLM
基准
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
揭示文本本征维度:从学术摘要到创意故事
LLM
自然语言处理
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:基于概念的万物分割
计算机视觉
语义分割
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:面向地理定位的网络增强 Agent 视觉推理
Agent
检索增强生成
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
OpenMMReasoner:以开放与通用的方案拓展多模态推理的前沿
监督式微调
推理
Kaichen Zhang, Keming Wu, Zuhao Yang, et al.
HiPO:面向LLMs动态推理的混合策略优化
推理
强化学习
Ken Deng, Zizheng Zhan, Wen Xiang, et al.
SERES:基于语义感知的稀疏视角神经重建
3D 生成
计算机视觉
Bo Xu, Yuhu Guo, Yuchao Wang, et al.
SDAR:一种用于可扩展序列生成的协同扩散-自回归范式
扩散模型
模型训练
Shuang Cheng, Yihan Bian, Dawei Liu, et al.
MultiPL-MoE:通过混合专家模型扩展大型语言模型的多编程语言能力
LLM
代码生成
Qing Wang, Xue Han, Jiahui Wang, et al.
CapRL:通过强化学习激发密集图像描述能力
图像描述
视觉问答
Long Xing, Xiaoyi Dong, Yuhang Zang, et al.
通过离散扩散发散指令实现超快速语言生成
扩散模型
文本生成
Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, et al.
DisCO:通过判别约束优化强化大型推理模型
强化学习
推理
Gang Li, Ming Lin, Tomer Galanti, et al.
QSVD:面向低精度视觉-语言模型中统一查询-键-值权重压缩的高效低秩近似
Transformer
视觉问答
Yutong Wang, Haiyu Wang, Sai Qian Zhang
嵌套学习:深度学习架构的幻觉
深度学习
自然语言处理
Ali Behrouz, Meisam Razaviyayn, Peiling Zhong, et al.
1
12
13
14
15
16
17
18
48