HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
自动驾驶中视觉-语言-行为模型的综述
Sicong Jiang, Zilin Huang, Kangan Qian, et al.
MoCa:模态感知的持续预训练生成更优的双向多模态嵌入
Haonan Chen, Hong Liu, Yuping Luo, et al.
FreeLong++:通过多频带谱融合实现无训练长视频生成
Yu Lu, Yi Yang
超越符号:从脑启发智能到人工通用智能的认知基础及其社会影响
Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, et al.
数学推理是否提升通用大语言模型的能力?理解大语言模型推理的可迁移性
Maggie Huan, Yuetai Li, Tuney Zheng, et al.
SciArena:科学文献任务中基础模型的开放评估平台
Yilun Zhao, Kaiyan Zhang, Tiansheng Hu, et al.
GLM-4.1V-Thinking:通过可扩展的强化学习实现多功能多模态推理
Wenyi Hong, Wenmeng Yu, Xiaotao Gu, et al.
医学中的整体人工智能:性能提升与可解释性增强
Periklis Petridis, Georgios Margaritis, Vasiliki Stoumpou, et al.
evolving prompts in-context: 一种开放式的、自我复制的视角
Wang, Jianyu, Hu, et al.
SPIRAL:零和博弈中的自我对弈通过多智能体多轮强化学习激励推理
Bo Liu, Leon Guertler, Simon Yu, et al.
面向听者的奖励性思考在视觉语言模型中的图像偏好研究
Alexander Gambashidze, Li Pengyi, Matvey Skripkin, et al.
Calligrapher:自由风格文本图像定制
Yue Ma, Qingyan Bai, Hao Ouyang, et al.
VMoBA:视频扩散模型中的块注意力混合方法
Jianzong Wu, Liang Hou, Haotian Yang, et al.
Ovis-U1 技术报告
Guo-Hua Wang, Shanshan Zhao, Xinjie Zhang, et al.
SMMILE:一种专家驱动的多模态医学情境学习基准
Melanie Rieff, Maya Varma, Ossian Rabow, et al.
自动LLM速通基准:重现NanoGPT改进
Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.
Shape-for-Motion:基于3D代理的精确一致视频编辑
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
从理想到现实:面向实际场景的统一且数据高效的密集预测
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
ShotBench:视觉-语言模型中的专家级电影理解
Hongbo Liu, Jingwen He, Yi Jin, et al.
XVerse:通过DiT调制实现一致的多主体身份和语义属性控制
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
24孔板中的零样本抗体设计
Chai Discovery Team
KinFormer:适用于催化有机反应动力学的通用动态符号回归
Jindou Chen, Jidong Tian, Liang Wu, et al.
MiCo:多图像对比强化视觉推理
Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.
细粒度偏好优化改进了VLM中的空间推理能力
Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.
Ark:一个基于Python的开源机器人学习框架
Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.
Pangu Pro MoE:分组专家混合以实现高效的稀疏性
Tang, Yehui, Li, et al.
LLaVA-Scissor:基于语义连通分量的视频大语言模型中的令牌压缩
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
BlenderFusion:基于3D的视觉编辑与生成合成
Chen, Jiacheng, Mehran, et al.
UniMate:一种统一的机械超材料生成、性能预测及条件确认模型
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
HealthGPT:一种通过异质知识适应统一理解与生成的医学大型视觉-语言模型
Tianwei Lin, Wenqiao Zhang, Sijing Li, et al.
学习跳过Transformer的中间层
Tim Lawson, Laurence Aitchison
SAM4D:在相机和激光雷达流中分割任何物体
Jianyun Xu, Song Wang, Ziqian Ni, et al.
1
30
31
32
33
34
35
36
37
自动驾驶中视觉-语言-行为模型的综述
Sicong Jiang, Zilin Huang, Kangan Qian, et al.
MoCa:模态感知的持续预训练生成更优的双向多模态嵌入
Haonan Chen, Hong Liu, Yuping Luo, et al.
FreeLong++:通过多频带谱融合实现无训练长视频生成
Yu Lu, Yi Yang
超越符号:从脑启发智能到人工通用智能的认知基础及其社会影响
Rizwan Qureshi, Ranjan Sapkota, Abbas Shah, et al.
数学推理是否提升通用大语言模型的能力?理解大语言模型推理的可迁移性
Maggie Huan, Yuetai Li, Tuney Zheng, et al.
SciArena:科学文献任务中基础模型的开放评估平台
Yilun Zhao, Kaiyan Zhang, Tiansheng Hu, et al.
GLM-4.1V-Thinking:通过可扩展的强化学习实现多功能多模态推理
Wenyi Hong, Wenmeng Yu, Xiaotao Gu, et al.
医学中的整体人工智能:性能提升与可解释性增强
Periklis Petridis, Georgios Margaritis, Vasiliki Stoumpou, et al.
evolving prompts in-context: 一种开放式的、自我复制的视角
Wang, Jianyu, Hu, et al.
SPIRAL:零和博弈中的自我对弈通过多智能体多轮强化学习激励推理
Bo Liu, Leon Guertler, Simon Yu, et al.
面向听者的奖励性思考在视觉语言模型中的图像偏好研究
Alexander Gambashidze, Li Pengyi, Matvey Skripkin, et al.
Calligrapher:自由风格文本图像定制
Yue Ma, Qingyan Bai, Hao Ouyang, et al.
VMoBA:视频扩散模型中的块注意力混合方法
Jianzong Wu, Liang Hou, Haotian Yang, et al.
Ovis-U1 技术报告
Guo-Hua Wang, Shanshan Zhao, Xinjie Zhang, et al.
SMMILE:一种专家驱动的多模态医学情境学习基准
Melanie Rieff, Maya Varma, Ossian Rabow, et al.
自动LLM速通基准:重现NanoGPT改进
Bingchen Zhao, Despoina Magka, Minqi Jiang, et al.
Shape-for-Motion:基于3D代理的精确一致视频编辑
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
从理想到现实:面向实际场景的统一且数据高效的密集预测
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
ShotBench:视觉-语言模型中的专家级电影理解
Hongbo Liu, Jingwen He, Yi Jin, et al.
XVerse:通过DiT调制实现一致的多主体身份和语义属性控制
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
24孔板中的零样本抗体设计
Chai Discovery Team
KinFormer:适用于催化有机反应动力学的通用动态符号回归
Jindou Chen, Jidong Tian, Liang Wu, et al.
MiCo:多图像对比强化视觉推理
Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.
细粒度偏好优化改进了VLM中的空间推理能力
Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.
Ark:一个基于Python的开源机器人学习框架
Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.
Pangu Pro MoE:分组专家混合以实现高效的稀疏性
Tang, Yehui, Li, et al.
LLaVA-Scissor:基于语义连通分量的视频大语言模型中的令牌压缩
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
BlenderFusion:基于3D的视觉编辑与生成合成
Chen, Jiacheng, Mehran, et al.
UniMate:一种统一的机械超材料生成、性能预测及条件确认模型
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
HealthGPT:一种通过异质知识适应统一理解与生成的医学大型视觉-语言模型
Tianwei Lin, Wenqiao Zhang, Sijing Li, et al.
学习跳过Transformer的中间层
Tim Lawson, Laurence Aitchison
SAM4D:在相机和激光雷达流中分割任何物体
Jianyun Xu, Song Wang, Ziqian Ni, et al.
1
30
31
32
33
34
35
36
37