HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
EvoCUA:通过从可扩展的合成经验中学习来演化计算机使用代理
Agent
LLM
Taofeng Xue, Chong Peng, Mianqiu Huang, et al.
HY-MT1.5 技术报告
翻译
LLM
Mao Zheng, Zheng Li, Tao Chen, et al.
代码的缩放定律:每种编程语言都至关重要
LLM
代码生成
Jian Yang, Shawn Guo, Lin Jing, et al.
Qwen3_TTS 技术报告
语音生成
音频和语音处理
Hangrui Hu, Xinfa Zhu, Ting He, et al.
小模型,大成果:通过分解实现卓越的意图抽取
Agent
人机交互
Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.
LightOnOCR:一种10亿参数的端到端多语言视觉-语言模型,实现最先进的OCR性能
OCR
文档理解
Said Taghadouini, Adrien Cavaillès, Baptiste Aubertin
FinVault:面向执行基础环境的金融Agent安全基准测试
基准
Agent
Zhi Yang, Runguo Li, Qiqi Qiang, et al.
MMDeepResearch-Bench:多模态深度研究Agent基准测试
基准
Agent
Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.
DARC:面向LLM演化的解耦非对称推理课程
LLM
推理
Shengda Fan, Xuyan Ye, Yankai Lin
面向具身世界的视频生成模型再思考
视频生成
具身智能
Yufan Deng, Zilin Pan, Hongyu Zhang, et al.
Paper2Rebuttal:一种用于透明化作者回复辅助的多智能体框架
Agent
检索增强生成
Qianli Ma, Chang Guo, Zhiheng Tian, et al.
LLM的智能体推理
推理
LLM
Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.
PERSONAPLEX:用于全双工对话语音模型的语音与角色控制
语音生成
音频和语音处理
Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.
FlashLabs Chroma 1.0:具备个性化语音克隆能力的实时端到端语音对话模型
LLM
语音生成
Tanyu Chen, Tairan Chen, Kai Shen, et al.
MemoryRewardBench:面向大型语言模型长期记忆管理的奖励模型基准测试
基准
偏好
Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.
OmniTransfer:面向时空视频迁移的统一框架
视频生成
文生视频
Pengze Zhang, Yanze Wu, Mengtian Li, et al.
面向高效智能体:记忆、工具学习与规划
Agent
LLM
Xiaofang Yang, Lijun Li, Heng Zhou, et al.
FutureOmni:基于多模态上下文的未来预测评估方法在多模态LLM中的应用
统一多模态
LLM
Qian Chen, Jinlan Fu, Changsong Li, et al.
Being-H0.5:面向跨体感泛化的以人为本机器人学习扩展
具身智能
机器人技术
Hao Luo, Ye Wang, Wanpeng Zhang, et al.
基于LLM的软件工程问题求解进展与前沿:一项综合调查
LLM
Agent
Caihua Li, Lianghong Guo, Yanlin Wang, et al.
Nemotron-Math:基于多模态监督的数学推理高效长上下文蒸馏
数据集
推理
Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.
为Gemini构建可投入生产的探测器
LLM
文本生成
János Kramár, Joshua Engels, Zheng Wang, et al.
LFM2 技术报告
LLM
检索增强生成
Alexander Amini, Anna Banaszak, Harold Benoit, et al.
CoDance:一种用于鲁棒多主体动画的解绑-重绑范式
图生视频
图生图
Shuai Tan, Biao Gong, Ke Ma, et al.
助手轴:语言模型默认人格的定位与稳定化
LLM
监督式微调
Christina Lu, Jack Gallagher, Jonathan Michala, et al.
ABC-Bench:面向真实世界开发中的智能体后端编码基准测试
Agent
基准
Jie Yang, Honglin Guo, Li Ji, et al.
多路思维:通过逐token分支与合并进行推理
推理
算法
Yao Tang, Li Dong, Yaru Hao, et al.
推理模型催生“思想百家”
Agent
推理
Junsol Kim, Shiyang Lai, Nino Scherrer, et al.
大规模多Agent AI系统发展与问题研究
开源
Agent
Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.
ACoT-VLA:面向视觉-语言-动作模型的动作思维链
机器人技术
具身智能
Linqing Zhong, Yi Liu, Yifei Wei, et al.
个性化误导之困:理解并缓解个性化LLM中的幻觉问题
LLM
智能问答
Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.
RubricHub:通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集
LLM
数据集
Sunzhu Li, Jiale Zhao, Miteto Wei, et al.
1
2
3
4
5
6
48
EvoCUA:通过从可扩展的合成经验中学习来演化计算机使用代理
Agent
LLM
Taofeng Xue, Chong Peng, Mianqiu Huang, et al.
HY-MT1.5 技术报告
翻译
LLM
Mao Zheng, Zheng Li, Tao Chen, et al.
代码的缩放定律:每种编程语言都至关重要
LLM
代码生成
Jian Yang, Shawn Guo, Lin Jing, et al.
Qwen3_TTS 技术报告
语音生成
音频和语音处理
Hangrui Hu, Xinfa Zhu, Ting He, et al.
小模型,大成果:通过分解实现卓越的意图抽取
Agent
人机交互
Danielle Cohen, Yoni Halpern, Noam Kahlon, et al.
LightOnOCR:一种10亿参数的端到端多语言视觉-语言模型,实现最先进的OCR性能
OCR
文档理解
Said Taghadouini, Adrien Cavaillès, Baptiste Aubertin
FinVault:面向执行基础环境的金融Agent安全基准测试
基准
Agent
Zhi Yang, Runguo Li, Qiqi Qiang, et al.
MMDeepResearch-Bench:多模态深度研究Agent基准测试
基准
Agent
Peizhou Huang, Zixuan Zhong, Zhongwei Wan, et al.
DARC:面向LLM演化的解耦非对称推理课程
LLM
推理
Shengda Fan, Xuyan Ye, Yankai Lin
面向具身世界的视频生成模型再思考
视频生成
具身智能
Yufan Deng, Zilin Pan, Hongyu Zhang, et al.
Paper2Rebuttal:一种用于透明化作者回复辅助的多智能体框架
Agent
检索增强生成
Qianli Ma, Chang Guo, Zhiheng Tian, et al.
LLM的智能体推理
推理
LLM
Tianxin Wei, Ting-Wei Li, Zhining Liu, et al.
PERSONAPLEX:用于全双工对话语音模型的语音与角色控制
语音生成
音频和语音处理
Rajarshi Roy, Jonathan Raiman, Sang-gil Lee, et al.
FlashLabs Chroma 1.0:具备个性化语音克隆能力的实时端到端语音对话模型
LLM
语音生成
Tanyu Chen, Tairan Chen, Kai Shen, et al.
MemoryRewardBench:面向大型语言模型长期记忆管理的奖励模型基准测试
基准
偏好
Zecheng Tang, Baibei Ji, Ruoxi Sun, et al.
OmniTransfer:面向时空视频迁移的统一框架
视频生成
文生视频
Pengze Zhang, Yanze Wu, Mengtian Li, et al.
面向高效智能体:记忆、工具学习与规划
Agent
LLM
Xiaofang Yang, Lijun Li, Heng Zhou, et al.
FutureOmni:基于多模态上下文的未来预测评估方法在多模态LLM中的应用
统一多模态
LLM
Qian Chen, Jinlan Fu, Changsong Li, et al.
Being-H0.5:面向跨体感泛化的以人为本机器人学习扩展
具身智能
机器人技术
Hao Luo, Ye Wang, Wanpeng Zhang, et al.
基于LLM的软件工程问题求解进展与前沿:一项综合调查
LLM
Agent
Caihua Li, Lianghong Guo, Yanlin Wang, et al.
Nemotron-Math:基于多模态监督的数学推理高效长上下文蒸馏
数据集
推理
Wei Du, Shubham Toshniwal, Branislav Kisacanin, et al.
为Gemini构建可投入生产的探测器
LLM
文本生成
János Kramár, Joshua Engels, Zheng Wang, et al.
LFM2 技术报告
LLM
检索增强生成
Alexander Amini, Anna Banaszak, Harold Benoit, et al.
CoDance:一种用于鲁棒多主体动画的解绑-重绑范式
图生视频
图生图
Shuai Tan, Biao Gong, Ke Ma, et al.
助手轴:语言模型默认人格的定位与稳定化
LLM
监督式微调
Christina Lu, Jack Gallagher, Jonathan Michala, et al.
ABC-Bench:面向真实世界开发中的智能体后端编码基准测试
Agent
基准
Jie Yang, Honglin Guo, Li Ji, et al.
多路思维:通过逐token分支与合并进行推理
推理
算法
Yao Tang, Li Dong, Yaru Hao, et al.
推理模型催生“思想百家”
Agent
推理
Junsol Kim, Shiyang Lai, Nino Scherrer, et al.
大规模多Agent AI系统发展与问题研究
开源
Agent
Daniel Liu, Krishna Upadhyay, Vinaik Chhetri, et al.
ACoT-VLA:面向视觉-语言-动作模型的动作思维链
机器人技术
具身智能
Linqing Zhong, Yi Liu, Yifei Wei, et al.
个性化误导之困:理解并缓解个性化LLM中的幻觉问题
LLM
智能问答
Zhongxiang Sun, Yi Zhan, Chenglei Shen, et al.
RubricHub:通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集
LLM
数据集
Sunzhu Li, Jiale Zhao, Miteto Wei, et al.
1
2
3
4
5
6
48