HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
解锁隐性经验:从文本中合成工具使用轨迹
LLM
Agent
Zhihao Xu, Rumei Li, Jiahuan Li, et al.
毒苹果效应:通过AI Agent的技术扩展对中介市场实施策略性操纵
人工智能
Agent
Eilam Shapira, Roi Reichart, Moshe Tennenholtz
你的组相对优势存在偏差
强化学习
LLM
Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.
STEM:通过嵌入模块扩展Transformer
Transformer
模型训练
Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.
迷失在噪声中:推理模型在上下文干扰项下的失效机制
基准
推理
Seongyun Lee, Yongrae Jo, Minju Seo, et al.
超越静态工具:面向科学推理的测试时工具演化
Agent
推理
Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.
VIBE:基于视觉指令的编辑器
文生视频
扩散模型
Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.
协作式多Agent测试时强化学习用于推理
Agent
强化学习
Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.
奖励稀有:面向LLM创造性问题求解的感知独特性强化学习
强化学习
推理
Zhiyuan Hu, Yucheng Wang, Yufei He, et al.
基于视觉-语言推理的城市社会语义分割
图像分割
语义分割
Yu Wang, Yi Wang, Rui Dai, et al.
STEP3-VL-10B 技术报告
多模态表征
视觉问答
Ailin Huang, Chengyuan Yao, Chunrui Han, et al.
SeedFold:扩展生物分子结构预测
Transformer
蛋白质
Yi Zhou, Chan Lu, Yiming Ma, et al.
TranslateGemma 技术报告
翻译
LLM
Mara Finkelstein, Isaac Caswell, Tobias Domhan, et al.
Fast-ThinkAct:通过可表述的潜在规划实现高效的视觉-语言-动作推理
具身智能
机器人技术
Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.
SkinFlow:通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输
LLM
图像生成
Lijun Liu, Linwei Chen, Zhishou Zhang, et al.
A^3-Bench:通过锚点与吸引子激活进行内存驱动型科学推理的基准测试
推理
基准
Jian Zhang, Yu He, Zhiyuan Wang, et al.
算法代码优化的受控自演化
代码生成
LLM
Tu Hu, Ronghao Chen, Shuo Zhang, et al.
MAXS:基于LLM Agent的元自适应探索
Agent
推理
Jian Zhang, Zhiyuan Wang, Zhangqi Wang, et al.
DeepResearchEval:一种用于深度研究任务构建与代理评估的自动化框架
Agent
基准
Yibo Wang, Lei Wang, Yue Deng, et al.
0型映射到旗流形空间的动机类
数学
算法
Jim Bryan, Balázs Elek, Freddie Manners, et al.
UniversalRAG:面向多模态与多粒度语料库的检索增强生成
检索增强生成
多模态表征
Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, et al.
对齐文本、代码与视觉:一种用于文本到可视化生成的多目标强化学习框架
LLM
代码生成
Mizanur Rahman, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, et al.
大语言模型在持续预训练过程中如何学习概念?
LLM
模型训练
Barry Menglong Yao, Sha Li, Yunzhi Yao, et al.
JudgeRLVR:先判断,后生成,实现高效推理
强化学习
推理
Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.
SnapGen++:释放扩散Transformer在边缘设备上高效高保真图像生成的潜力
扩散模型
图像生成
Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.
视频生成中的运动归因
视频生成
文生视频
Xindi Wu, Despoina Paschalidou, Jun Gao, et al.
Ministral 3
LLM
文本生成
Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.
置信度二分法:工具使用Agent中误校准问题的分析与缓解
强化学习
Agent
Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.
ArenaRL:通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展
强化学习
偏好
Qiang Zhang, Boli Chen, Fanrui Zhang, et al.
ShowUI-π:基于流的生成模型作为GUI灵巧手
通义千问
人机交互
Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou
在野外学习潜在动作世界模型
具身智能
文生视频
Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.
Dr. Zero:无需训练数据的自演化搜索Agent
Agent
推理
Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.
1
2
3
4
5
6
7
48
解锁隐性经验:从文本中合成工具使用轨迹
LLM
Agent
Zhihao Xu, Rumei Li, Jiahuan Li, et al.
毒苹果效应:通过AI Agent的技术扩展对中介市场实施策略性操纵
人工智能
Agent
Eilam Shapira, Roi Reichart, Moshe Tennenholtz
你的组相对优势存在偏差
强化学习
LLM
Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.
STEM:通过嵌入模块扩展Transformer
Transformer
模型训练
Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.
迷失在噪声中:推理模型在上下文干扰项下的失效机制
基准
推理
Seongyun Lee, Yongrae Jo, Minju Seo, et al.
超越静态工具:面向科学推理的测试时工具演化
Agent
推理
Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.
VIBE:基于视觉指令的编辑器
文生视频
扩散模型
Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.
协作式多Agent测试时强化学习用于推理
Agent
强化学习
Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.
奖励稀有:面向LLM创造性问题求解的感知独特性强化学习
强化学习
推理
Zhiyuan Hu, Yucheng Wang, Yufei He, et al.
基于视觉-语言推理的城市社会语义分割
图像分割
语义分割
Yu Wang, Yi Wang, Rui Dai, et al.
STEP3-VL-10B 技术报告
多模态表征
视觉问答
Ailin Huang, Chengyuan Yao, Chunrui Han, et al.
SeedFold:扩展生物分子结构预测
Transformer
蛋白质
Yi Zhou, Chan Lu, Yiming Ma, et al.
TranslateGemma 技术报告
翻译
LLM
Mara Finkelstein, Isaac Caswell, Tobias Domhan, et al.
Fast-ThinkAct:通过可表述的潜在规划实现高效的视觉-语言-动作推理
具身智能
机器人技术
Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.
SkinFlow:通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输
LLM
图像生成
Lijun Liu, Linwei Chen, Zhishou Zhang, et al.
A^3-Bench:通过锚点与吸引子激活进行内存驱动型科学推理的基准测试
推理
基准
Jian Zhang, Yu He, Zhiyuan Wang, et al.
算法代码优化的受控自演化
代码生成
LLM
Tu Hu, Ronghao Chen, Shuo Zhang, et al.
MAXS:基于LLM Agent的元自适应探索
Agent
推理
Jian Zhang, Zhiyuan Wang, Zhangqi Wang, et al.
DeepResearchEval:一种用于深度研究任务构建与代理评估的自动化框架
Agent
基准
Yibo Wang, Lei Wang, Yue Deng, et al.
0型映射到旗流形空间的动机类
数学
算法
Jim Bryan, Balázs Elek, Freddie Manners, et al.
UniversalRAG:面向多模态与多粒度语料库的检索增强生成
检索增强生成
多模态表征
Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, et al.
对齐文本、代码与视觉:一种用于文本到可视化生成的多目标强化学习框架
LLM
代码生成
Mizanur Rahman, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, et al.
大语言模型在持续预训练过程中如何学习概念?
LLM
模型训练
Barry Menglong Yao, Sha Li, Yunzhi Yao, et al.
JudgeRLVR:先判断,后生成,实现高效推理
强化学习
推理
Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.
SnapGen++:释放扩散Transformer在边缘设备上高效高保真图像生成的潜力
扩散模型
图像生成
Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.
视频生成中的运动归因
视频生成
文生视频
Xindi Wu, Despoina Paschalidou, Jun Gao, et al.
Ministral 3
LLM
文本生成
Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.
置信度二分法:工具使用Agent中误校准问题的分析与缓解
强化学习
Agent
Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.
ArenaRL:通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展
强化学习
偏好
Qiang Zhang, Boli Chen, Fanrui Zhang, et al.
ShowUI-π:基于流的生成模型作为GUI灵巧手
通义千问
人机交互
Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou
在野外学习潜在动作世界模型
具身智能
文生视频
Quentin Garrido, Tushar Nagarajan, Basile Terver, et al.
Dr. Zero:无需训练数据的自演化搜索Agent
Agent
推理
Zhenrui Yue, Kartikeya Upasani, Xianjun Yang, et al.
1
2
3
4
5
6
7
48