HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
通义千问3-VL 技术报告
统一多模态
多模态表征
Shuai Bai, Yuxuan Cai, Ruizhe Chen, et al.
G$^2$VLM:具有统一3D重建与空间推理能力的几何引导视觉语言模型
多模态
多模态表征
Wenbo Hu, Jingli Lin, Yilin Long, et al.
Multi-Crit:基于多元标准遵循的多模态评判基准
基准
多模态
Tianyi Xiong, Yi Ge, Ming Li, et al.
MIRA:用于图像编辑的多模态迭代推理Agent
多模态
扩散模型
Ziyun Zeng, Hang Hua, Jiebo Luo
ENACT:基于第一人称交互世界建模的具身认知评估
视觉问答
具身智能
Qineng Wang, Wenlong Huang, Yu Zhou, et al.
画布到图像:基于多模态控制的组合图像生成
扩散模型
图像生成
Yusuf Dalva, Guocheng Gordon Qian, Maya Goldenberg, et al.
视频生成模型是优秀的潜在奖励模型
统一多模态
扩散模型
Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.
DeepSeekMath-V2:迈向自验证的数学推理
LLM
推理
Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.
ToolOrchestra:通过高效的模型与工具编排提升智能
Agent
推理
Hongjin Su, Shizhe Diao, Ximing Lu, et al.
视觉思考,文本推理:ARC中的视觉-语言协同作用
多模态
推理
Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.
和谐:通过跨任务协同实现音频与视频生成的协同统一
扩散模型
统一多模态
Teng Hu, Zhentao Yu, Guozhen Zhang, et al.
Inferix:一种基于块扩散的下一代推理引擎,用于世界模拟
视频理解
合成
Inferix Team, Tianyu Feng, Yizeng Han, et al.
多智能体系统中的潜在协作
Agent
LLM
Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.
多模态评估俄语语言架构
多模态
基准
Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.
ROOT:用于神经网络训练的鲁棒正交化优化器
LLM
Transformer
Wei He, Kai Han, Hang Zhou, et al.
叠加效应带来稳健的神经缩放
机器学习
人工智能
Yizhou Liu, Ziming Liu, Jeff Gore
直接在线学习的最优错误界
机器学习
人工智能
Zachary Chase, Steve Hanneke, Shay Moran, et al.
强化学习是否真的能够激励LLM在基础模型之外提升推理能力?
强化学习
LLM
Yang Yue, Zhiqi Chen, Rui Lu, et al.
扩散模型为何不会记忆:训练中隐式动力学正则化的作用
扩散模型
深度学习
Tony Bonnaire, Raphaël Urfin, Giulio Biroli, et al.
用于自监督强化学习的1000层网络:增加深度可实现新的目标达成能力
强化学习
神经网络
Kevin Wang, Ishaan Javali, Michał Bortkiewicz, et al.
用于大型语言模型的门控注意力:非线性、稀疏性与无注意力陷阱
Transformer
LLM
Zihan Qiu, Zekun Wang, Bo Zheng, et al.
人工蜂群智能:语言模型(及更广泛领域)的开放性同质性
LLM
数据集
Liwei Jiang, Yuanjun Chai, Margaret Li, et al.
超大规模下的进化策略
模型训练
LLM
Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.
理解是否推动统一多模态模型中的生成?从分析到未来路径
统一多模态
推理
Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.
iMontage:统一、通用、高度动态的多对多图像生成
统一多模态
图像生成
Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.
Agent0-VL:探索面向工具融合的视觉-语言推理的自演化智能体
Agent
推理
Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.
MedSAM3:基于医学概念深入探索通用图像分割
图像分割
统一多模态
Anglin Liu, Rundong Xue, Xu R. Cao, et al.
SteadyDancer:基于首帧保留的协调一致的人体图像动画
图生视频
图生图
Jiaming Zhang, Shengming Cao, Rui Li, et al.
GigaEvo:一个由 LLMs 和进化算法驱动的开源优化框架
LLM
算法
Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.
基于随机路径积分的忠实度感知推荐解释
偏好
基准
Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.
提取推荐系统中的交互感知单语义概念
深度学习
神经网络
Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.
MSRNet:用于伪装目标检测的多尺度递归网络
目标检测
语义分割
Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.
1
11
12
13
14
15
16
17
48
通义千问3-VL 技术报告
统一多模态
多模态表征
Shuai Bai, Yuxuan Cai, Ruizhe Chen, et al.
G$^2$VLM:具有统一3D重建与空间推理能力的几何引导视觉语言模型
多模态
多模态表征
Wenbo Hu, Jingli Lin, Yilin Long, et al.
Multi-Crit:基于多元标准遵循的多模态评判基准
基准
多模态
Tianyi Xiong, Yi Ge, Ming Li, et al.
MIRA:用于图像编辑的多模态迭代推理Agent
多模态
扩散模型
Ziyun Zeng, Hang Hua, Jiebo Luo
ENACT:基于第一人称交互世界建模的具身认知评估
视觉问答
具身智能
Qineng Wang, Wenlong Huang, Yu Zhou, et al.
画布到图像:基于多模态控制的组合图像生成
扩散模型
图像生成
Yusuf Dalva, Guocheng Gordon Qian, Maya Goldenberg, et al.
视频生成模型是优秀的潜在奖励模型
统一多模态
扩散模型
Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.
DeepSeekMath-V2:迈向自验证的数学推理
LLM
推理
Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.
ToolOrchestra:通过高效的模型与工具编排提升智能
Agent
推理
Hongjin Su, Shizhe Diao, Ximing Lu, et al.
视觉思考,文本推理:ARC中的视觉-语言协同作用
多模态
推理
Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.
和谐:通过跨任务协同实现音频与视频生成的协同统一
扩散模型
统一多模态
Teng Hu, Zhentao Yu, Guozhen Zhang, et al.
Inferix:一种基于块扩散的下一代推理引擎,用于世界模拟
视频理解
合成
Inferix Team, Tianyu Feng, Yizeng Han, et al.
多智能体系统中的潜在协作
Agent
LLM
Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.
多模态评估俄语语言架构
多模态
基准
Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.
ROOT:用于神经网络训练的鲁棒正交化优化器
LLM
Transformer
Wei He, Kai Han, Hang Zhou, et al.
叠加效应带来稳健的神经缩放
机器学习
人工智能
Yizhou Liu, Ziming Liu, Jeff Gore
直接在线学习的最优错误界
机器学习
人工智能
Zachary Chase, Steve Hanneke, Shay Moran, et al.
强化学习是否真的能够激励LLM在基础模型之外提升推理能力?
强化学习
LLM
Yang Yue, Zhiqi Chen, Rui Lu, et al.
扩散模型为何不会记忆:训练中隐式动力学正则化的作用
扩散模型
深度学习
Tony Bonnaire, Raphaël Urfin, Giulio Biroli, et al.
用于自监督强化学习的1000层网络:增加深度可实现新的目标达成能力
强化学习
神经网络
Kevin Wang, Ishaan Javali, Michał Bortkiewicz, et al.
用于大型语言模型的门控注意力:非线性、稀疏性与无注意力陷阱
Transformer
LLM
Zihan Qiu, Zekun Wang, Bo Zheng, et al.
人工蜂群智能:语言模型(及更广泛领域)的开放性同质性
LLM
数据集
Liwei Jiang, Yuanjun Chai, Margaret Li, et al.
超大规模下的进化策略
模型训练
LLM
Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.
理解是否推动统一多模态模型中的生成?从分析到未来路径
统一多模态
推理
Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.
iMontage:统一、通用、高度动态的多对多图像生成
统一多模态
图像生成
Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.
Agent0-VL:探索面向工具融合的视觉-语言推理的自演化智能体
Agent
推理
Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.
MedSAM3:基于医学概念深入探索通用图像分割
图像分割
统一多模态
Anglin Liu, Rundong Xue, Xu R. Cao, et al.
SteadyDancer:基于首帧保留的协调一致的人体图像动画
图生视频
图生图
Jiaming Zhang, Shengming Cao, Rui Li, et al.
GigaEvo:一个由 LLMs 和进化算法驱动的开源优化框架
LLM
算法
Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.
基于随机路径积分的忠实度感知推荐解释
偏好
基准
Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.
提取推荐系统中的交互感知单语义概念
深度学习
神经网络
Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.
MSRNet:用于伪装目标检测的多尺度递归网络
目标检测
语义分割
Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.
1
11
12
13
14
15
16
17
48