HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
SmolDocling:一种超紧凑的视觉-语言模型,用于端到端多模态文档转换
Ahmed Nassar, Andres Marafioti, Matteo Omenetti, et al.
VA-MoE:面向增量天气预报的变量自适应专家混合模型
Hao Chen, Han Tao, Guo Song, et al.
华佗GPT-Vision,面向大规模注入医学视觉知识到多模态LLM
Junying Chen, Ruyi Ouyang, Anningzhe Gao, et al.
输入重构如何提升复杂动态环境中工具使用准确性?基于τ-bench 的研究
Venkatesh Mishra, Amir Saeidi, Satyam Raj, et al.
ALLaM 34B 的 UI 级评估:通过 HUMAIN Chat 测量以阿拉伯语为中心的 LLM
Omer Nacar
从反应式到认知式:面向具身Agent的类脑空间智能
Shouwei Ruan, Liyuan Wang, Caixin Kang, et al.
无标签遗漏:适用于所有监督模式的统一表面缺陷检测模型
Blaž Rolih, Matic Fučka, Danijel Skočaj
T2R-bench:一个从真实工业表格生成文章级报告的基准测试
Jie Zhang, Changzai Pan, Kaiwen Wei, et al.
PVPO:面向智能体推理的预估价值策略优化
Wenfeng Feng, Penghong Zhao, Guochao Jiang, et al.
UQ:在未解问题上评估语言模型
Fan Nie, Ken Ziyu Liu, Zihao Wang, et al.
CARJAN:基于Agent的交通场景生成与仿真方法——AJAN
Leonard Frank Neis, Andre Antakli, Matthias Klusch
TiKMiX:在语言模型预训练中引入数据影响的动态混合机制
Yifan Wang, Binbin Liu, Fengze Liu, et al.
TalkVid:一个大规模多样化音频驱动说话头合成数据集
Shunian Chen, Hejin Huang, Yexin Liu, et al.
Droplet3D:来自视频的常识先验促进3D生成
Xiaochuan Li, Guoguang Du, Runze Zhang, et al.
A.S.E:面向AI生成代码安全性的仓库级基准测试
Keke Lian, Bin Wang, Lei Zhang, et al.
EmbodiedOneVision:面向通用机器人控制的交织视觉-文本-动作预训练
Delin Qu, Haoming Song, Qizhi Chen, et al.
R-4B:通过双模式退火与强化学习激励多模态大模型的通用自动思考能力
Jie Jiang, Qi Yang, Bolin Ni, et al.
激发小规模语言模型的创意写作:基于LLM的评判与多智能体精炼奖励
Xiaolong Wei, Bo Lu, Xingyu Zhang, et al.
TMUAD:通过文本记忆库增强统一异常检测模型的逻辑能力
Jiawei Liu, Jiahe Hou, Wei Wang, et al.
思维链动态分析:主动引导还是不忠实的事后合理化?
Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, et al.
AWorld:面向智能体AI训练配方的编排
Chengyue Yu, Siyuan Lu, Chenyi Zhuang, et al.
MCP-Bench:通过MCP服务器对复杂现实世界任务中使用工具的LLM Agent进行基准测试
Zhenting Wang, Qi Chang, Hemani Patel, et al.
USO:通过解耦与奖励学习实现统一风格与主体驱动生成
Shaojin Wu, Mengqi Huang, Yufeng Cheng, et al.
rStar2-Agent:代理式推理技术报告
Ning Shang, Yifei Liu, Yi Zhu, et al.
Pref-GRPO:基于成对偏好奖励的GRPO用于稳定文本到图像强化学习
Yibin Wang, Zhimin Li, Yuhang Zang, et al.
MobileCLIP2:提升多模态强化训练
Fartash Faghri, Pavan Kumar Anasosalu Vasu, Cem Koc, et al.
AI-AI 审美协作:显式符号学意识与涌现语法发展
Nicanor I. Moldovan
凝视心灵:用于rPPG与健康生物标志物估计的多视角视频数据集
Konstantin Egorov, Stepan Botman, Pavel Blinov, et al.
预测下一个标记的顺序可提升语言建模性能
Zayd M. K. Zuhri, Erland Hilman Fuadi, Alham Fikri Aji
MIDAS:通过实时自回归视频生成实现的多模态交互式数字人合成
Ming Chen, Liyuan Cui, Wenyuan Zhang, et al.
离散扩散VLA:将离散扩散引入视觉-语言-动作策略中的动作解码
Zhixuan Liang, Yizhuo Li, Tianshuo Yang, et al.
通过推理分解的自奖励视觉-语言模型
Zongxia Li, Wenhao Yu, Chengsong Huang, et al.
1
18
19
20
21
22
23
24
37
SmolDocling:一种超紧凑的视觉-语言模型,用于端到端多模态文档转换
Ahmed Nassar, Andres Marafioti, Matteo Omenetti, et al.
VA-MoE:面向增量天气预报的变量自适应专家混合模型
Hao Chen, Han Tao, Guo Song, et al.
华佗GPT-Vision,面向大规模注入医学视觉知识到多模态LLM
Junying Chen, Ruyi Ouyang, Anningzhe Gao, et al.
输入重构如何提升复杂动态环境中工具使用准确性?基于τ-bench 的研究
Venkatesh Mishra, Amir Saeidi, Satyam Raj, et al.
ALLaM 34B 的 UI 级评估:通过 HUMAIN Chat 测量以阿拉伯语为中心的 LLM
Omer Nacar
从反应式到认知式:面向具身Agent的类脑空间智能
Shouwei Ruan, Liyuan Wang, Caixin Kang, et al.
无标签遗漏:适用于所有监督模式的统一表面缺陷检测模型
Blaž Rolih, Matic Fučka, Danijel Skočaj
T2R-bench:一个从真实工业表格生成文章级报告的基准测试
Jie Zhang, Changzai Pan, Kaiwen Wei, et al.
PVPO:面向智能体推理的预估价值策略优化
Wenfeng Feng, Penghong Zhao, Guochao Jiang, et al.
UQ:在未解问题上评估语言模型
Fan Nie, Ken Ziyu Liu, Zihao Wang, et al.
CARJAN:基于Agent的交通场景生成与仿真方法——AJAN
Leonard Frank Neis, Andre Antakli, Matthias Klusch
TiKMiX:在语言模型预训练中引入数据影响的动态混合机制
Yifan Wang, Binbin Liu, Fengze Liu, et al.
TalkVid:一个大规模多样化音频驱动说话头合成数据集
Shunian Chen, Hejin Huang, Yexin Liu, et al.
Droplet3D:来自视频的常识先验促进3D生成
Xiaochuan Li, Guoguang Du, Runze Zhang, et al.
A.S.E:面向AI生成代码安全性的仓库级基准测试
Keke Lian, Bin Wang, Lei Zhang, et al.
EmbodiedOneVision:面向通用机器人控制的交织视觉-文本-动作预训练
Delin Qu, Haoming Song, Qizhi Chen, et al.
R-4B:通过双模式退火与强化学习激励多模态大模型的通用自动思考能力
Jie Jiang, Qi Yang, Bolin Ni, et al.
激发小规模语言模型的创意写作:基于LLM的评判与多智能体精炼奖励
Xiaolong Wei, Bo Lu, Xingyu Zhang, et al.
TMUAD:通过文本记忆库增强统一异常检测模型的逻辑能力
Jiawei Liu, Jiahe Hou, Wei Wang, et al.
思维链动态分析:主动引导还是不忠实的事后合理化?
Samuel Lewis-Lim, Xingwei Tan, Zhixue Zhao, et al.
AWorld:面向智能体AI训练配方的编排
Chengyue Yu, Siyuan Lu, Chenyi Zhuang, et al.
MCP-Bench:通过MCP服务器对复杂现实世界任务中使用工具的LLM Agent进行基准测试
Zhenting Wang, Qi Chang, Hemani Patel, et al.
USO:通过解耦与奖励学习实现统一风格与主体驱动生成
Shaojin Wu, Mengqi Huang, Yufeng Cheng, et al.
rStar2-Agent:代理式推理技术报告
Ning Shang, Yifei Liu, Yi Zhu, et al.
Pref-GRPO:基于成对偏好奖励的GRPO用于稳定文本到图像强化学习
Yibin Wang, Zhimin Li, Yuhang Zang, et al.
MobileCLIP2:提升多模态强化训练
Fartash Faghri, Pavan Kumar Anasosalu Vasu, Cem Koc, et al.
AI-AI 审美协作:显式符号学意识与涌现语法发展
Nicanor I. Moldovan
凝视心灵:用于rPPG与健康生物标志物估计的多视角视频数据集
Konstantin Egorov, Stepan Botman, Pavel Blinov, et al.
预测下一个标记的顺序可提升语言建模性能
Zayd M. K. Zuhri, Erland Hilman Fuadi, Alham Fikri Aji
MIDAS:通过实时自回归视频生成实现的多模态交互式数字人合成
Ming Chen, Liyuan Cui, Wenyuan Zhang, et al.
离散扩散VLA:将离散扩散引入视觉-语言-动作策略中的动作解码
Zhixuan Liang, Yizhuo Li, Tianshuo Yang, et al.
通过推理分解的自奖励视觉-语言模型
Zongxia Li, Wenhao Yu, Chengsong Huang, et al.
1
18
19
20
21
22
23
24
37