HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
多模态基础模型能否理解示意图?——科学论文信息检索问答的实证研究
视觉问答
文档理解
Yilun Zhao, Chengye Wang, Chuhan Li, et al.
最优数据混合的比例定律
LLM
多模态
Mustafa Shukor, Louis Bethune, Dan Busbridge, et al.
主题一致且姿态多样的文本到图像生成
文生图
扩散模型
Zhanxin Gao, Beier Zhu, Liang Yao, et al.
视觉-语言-视觉自动编码器:从扩散模型中进行可扩展的知识蒸馏
图像描述
扩散模型
Tiezheng Zhang, Yitong Li, Yu-cheng Chou, et al.
DuetGraph:基于粗到精的双路径全局-局部融合知识图谱推理
推理
深度学习
Jin Li, Zezhong Ding, Xike Xie
CogDDN: 一种基于认知需求的导航方法,结合决策优化和双重加工思维
Agent
推理
Yuehao Huang, Liang Liu, Shuangming Lei, et al.
LayerCake: 在大型语言模型层中进行 Token 意识对比解码
LLM
Transformer
Jingze Zhu, Yongliang Wu, Wenbo Zhu, et al.
递归混合:学习动态递归深度以适应性地进行 token 级计算
Transformer
LLM
Sangmin Bae, Yujin Kim, Reza Bayat, et al.
REST:通过同时提出多个问题对大型推理模型进行压力测试
基准
推理
Zhuoshi Pan, Qizhi Pei, Yu Li, et al.
EmbRACE-3K:复杂环境中的具身推理与行动
具身智能
基准
Mingxian Lin, Wei Huang, Yitang Li, et al.
推理还是记忆?强化学习因数据污染而产生的不可靠结果
基准
强化学习
Mingqi Wu, Zhihao Zhang, Qiaole Dong, et al.
SpeakerVid-5M:一个大规模高质量的音频视觉二人互动人类生成数据集
视频理解
多模态
Youliang Zhang, Zhaoyang Li, Duomin Wang, et al.
VerifyBench:一个跨领域的推理验证系统基准测试
基准
LLM
Xuzhao Li, Xuchen Li, Shiyu Hu, et al.
使用 FAMPNN 进行全原子蛋白质序列设计的侧链调节和建模
Transformer
深度学习
Talal Widatalla, Richard W. Shuai, Brian Hie, et al.
一个 Token 欺骗LLM法官
LLM
基准
Yulai Zhao, Haolin Liu, Dian Yu, et al.
从一到多:用于3D生成的情境部分潜在变量
3D 生成
扩散模型
Shaocong Dong, Lihe Ding, Xiao Chen, et al.
开放视觉推理器:将语言认知行为迁移至视觉推理
视觉问答
推理
Yana Wei, Liang Zhao, Jianjian Sun, et al.
Lumos-1:从统一模型视角探讨自回归视频生成
统一多模态
LLM
Hangjie Yuan, Weihua Chen, Jun Cen, et al.
神经驱动的图像编辑
多模态
图生图
Pengfei Zhou, Jie Xia, Xiaopeng Peng, et al.
KV缓存引导以诱导小型语言模型的推理能力
推理
算法
Max Belitsky, Dawid J. Kopiczko, Michael Dorkenwald, et al.
NeuralOS:基于神经生成模型的操作系统仿真
人机交互
视频理解
Luke Rivard, Sun Sun, Hongyu Guo, et al.
CLiFT:用于计算高效和自适应神经渲染的压缩光场标记
机器视觉 3D
深度估计
Zhengqing Wang, Yuefan Wu, Jiacheng Chen, et al.
测试时使用反射生成模型进行缩放
推理
Transformer
Zixiao Wang, Yuxin Wang, Xiaorui Wang, et al.
系统建模与优化:一种综合框架用于多式联运移动性
建模
合成
Paul Saves, Jasper Bussemaker, R\u00e9mi Lafage, et al.
全原子扩散 Transformers:分子和材料的统一生成建模
扩散模型
Transformer
Chaitanya K. Joshi, Xiang Fu, Yi-Lun Liao, et al.
OST-Bench:评估多模态大语言模型在在线时空场景理解中的能力
视觉问答
Agent
JingLi Lin, Chenming Zhu, Runsen Xu, et al.
可追溯证据增强的视觉基础推理:评估与方法学
视觉问答
推理
Haochen Wang, Xiangtai Li, Zilong Huang, et al.
MIRIX:基于LLM的多智能体记忆系统
LLM
视觉问答
Yu Wang, Xi Chen
Skywork-R1V3 技术报告
视觉问答
多模态
Wei Shen, Jiangbo Pei, Yi Peng, et al.
T-LoRA:无需过拟合的单图像扩散模型定制
扩散模型
图像生成
Vera Soboleva, Aibek Alanov, Andrey Kuznetsov, et al.
将强化学习应用于长视频
视觉问答
LLM
Yukang Chen, Wei Huang, Baifeng Shi, et al.
世界模型的批判
建模
推理
Eric Xing, Mingkai Deng, Jinyu Hou, et al.
1
39
40
41
42
43
44
45
48
多模态基础模型能否理解示意图?——科学论文信息检索问答的实证研究
视觉问答
文档理解
Yilun Zhao, Chengye Wang, Chuhan Li, et al.
最优数据混合的比例定律
LLM
多模态
Mustafa Shukor, Louis Bethune, Dan Busbridge, et al.
主题一致且姿态多样的文本到图像生成
文生图
扩散模型
Zhanxin Gao, Beier Zhu, Liang Yao, et al.
视觉-语言-视觉自动编码器:从扩散模型中进行可扩展的知识蒸馏
图像描述
扩散模型
Tiezheng Zhang, Yitong Li, Yu-cheng Chou, et al.
DuetGraph:基于粗到精的双路径全局-局部融合知识图谱推理
推理
深度学习
Jin Li, Zezhong Ding, Xike Xie
CogDDN: 一种基于认知需求的导航方法,结合决策优化和双重加工思维
Agent
推理
Yuehao Huang, Liang Liu, Shuangming Lei, et al.
LayerCake: 在大型语言模型层中进行 Token 意识对比解码
LLM
Transformer
Jingze Zhu, Yongliang Wu, Wenbo Zhu, et al.
递归混合:学习动态递归深度以适应性地进行 token 级计算
Transformer
LLM
Sangmin Bae, Yujin Kim, Reza Bayat, et al.
REST:通过同时提出多个问题对大型推理模型进行压力测试
基准
推理
Zhuoshi Pan, Qizhi Pei, Yu Li, et al.
EmbRACE-3K:复杂环境中的具身推理与行动
具身智能
基准
Mingxian Lin, Wei Huang, Yitang Li, et al.
推理还是记忆?强化学习因数据污染而产生的不可靠结果
基准
强化学习
Mingqi Wu, Zhihao Zhang, Qiaole Dong, et al.
SpeakerVid-5M:一个大规模高质量的音频视觉二人互动人类生成数据集
视频理解
多模态
Youliang Zhang, Zhaoyang Li, Duomin Wang, et al.
VerifyBench:一个跨领域的推理验证系统基准测试
基准
LLM
Xuzhao Li, Xuchen Li, Shiyu Hu, et al.
使用 FAMPNN 进行全原子蛋白质序列设计的侧链调节和建模
Transformer
深度学习
Talal Widatalla, Richard W. Shuai, Brian Hie, et al.
一个 Token 欺骗LLM法官
LLM
基准
Yulai Zhao, Haolin Liu, Dian Yu, et al.
从一到多:用于3D生成的情境部分潜在变量
3D 生成
扩散模型
Shaocong Dong, Lihe Ding, Xiao Chen, et al.
开放视觉推理器:将语言认知行为迁移至视觉推理
视觉问答
推理
Yana Wei, Liang Zhao, Jianjian Sun, et al.
Lumos-1:从统一模型视角探讨自回归视频生成
统一多模态
LLM
Hangjie Yuan, Weihua Chen, Jun Cen, et al.
神经驱动的图像编辑
多模态
图生图
Pengfei Zhou, Jie Xia, Xiaopeng Peng, et al.
KV缓存引导以诱导小型语言模型的推理能力
推理
算法
Max Belitsky, Dawid J. Kopiczko, Michael Dorkenwald, et al.
NeuralOS:基于神经生成模型的操作系统仿真
人机交互
视频理解
Luke Rivard, Sun Sun, Hongyu Guo, et al.
CLiFT:用于计算高效和自适应神经渲染的压缩光场标记
机器视觉 3D
深度估计
Zhengqing Wang, Yuefan Wu, Jiacheng Chen, et al.
测试时使用反射生成模型进行缩放
推理
Transformer
Zixiao Wang, Yuxin Wang, Xiaorui Wang, et al.
系统建模与优化:一种综合框架用于多式联运移动性
建模
合成
Paul Saves, Jasper Bussemaker, R\u00e9mi Lafage, et al.
全原子扩散 Transformers:分子和材料的统一生成建模
扩散模型
Transformer
Chaitanya K. Joshi, Xiang Fu, Yi-Lun Liao, et al.
OST-Bench:评估多模态大语言模型在在线时空场景理解中的能力
视觉问答
Agent
JingLi Lin, Chenming Zhu, Runsen Xu, et al.
可追溯证据增强的视觉基础推理:评估与方法学
视觉问答
推理
Haochen Wang, Xiangtai Li, Zilong Huang, et al.
MIRIX:基于LLM的多智能体记忆系统
LLM
视觉问答
Yu Wang, Xi Chen
Skywork-R1V3 技术报告
视觉问答
多模态
Wei Shen, Jiangbo Pei, Yi Peng, et al.
T-LoRA:无需过拟合的单图像扩散模型定制
扩散模型
图像生成
Vera Soboleva, Aibek Alanov, Andrey Kuznetsov, et al.
将强化学习应用于长视频
视觉问答
LLM
Yukang Chen, Wei Huang, Baifeng Shi, et al.
世界模型的批判
建模
推理
Eric Xing, Mingkai Deng, Jinyu Hou, et al.
1
39
40
41
42
43
44
45
48