HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
基于指令的视频编辑的规模化:高质量合成数据集
统一多模态
合成
Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.
OmniVinci:提升架构与数据以实现全模态理解 LLM
多模态表征
统一多模态
Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.
关于LLM推理中内部概率与自洽性衔接的理论研究
推理
LLM
Zhi Zhou, Yuhao Tan, Zenan Li, et al.
DeepSeek-OCR:上下文光学压缩
OCR
LLM
Haoran Wei, Yaofeng Sun, Yukun Li
带有未观测偏好异质性的直接偏好优化:三元偏好必要性
偏好
LLM
Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis
用于概率天气预报的滚动扩散模型阐释
扩散模型
深度学习
Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.
图像搜索:超越语义依赖约束的视频生成自适应测试时搜索
统一多模态
文生视频
Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.
从像素到文字——迈向大规模原生视觉-语言原子单元
多模态
多模态表征
Haiwen Diao, Mingxuan Li, Silei Wu, et al.
面向服务的AI:通过AI眼镜实现主动辅助
Agent
多模态
Zichen Wen, Yiyu Wang, Chenfei Liao, et al.
WithAnyone:迈向可控且ID一致的图像生成
文生图
图像生成
Hengyuan Xu, Wei Cheng, Peng Xing, et al.
代理熵平衡策略优化
强化学习
Agent
Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.
当模型说谎时,我们得以学习:基于PsiloQA的多语言跨度级幻觉检测
数据集
LLM
Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.
基于深度学习预测多模板PCR中的序列特异性扩增效率
深度学习
卷积神经网络
Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.
基因组分析工具:一种用于分析下一代DNA测序数据的MapReduce框架
基因组学
高性能计算
Aaron McKenna, Matthew Hanna, Eric Banks, et al.
LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具
建模
高性能计算
Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.
LabOS:能够感知并协同人类的AI-XR共科研人员
Le Cong, Zaixi Zhang, Xiaotong Wang, et al.
海豚:基于异构锚点提示的文档图像解析
文档理解
多模态
Hao Feng, Shu Wei, Xiang Fei, et al.
LiveCC:基于大规模流式语音转录学习视频LLM
LLM
视觉问答
Joya Chen, Ziyun Zeng, Yiqi Lin, et al.
DeepMMSearch-R1:赋能多模态LLM在多模态网络搜索中的应用
视觉问答
检索增强生成
Kartik Narayan, Yang Xu, Tian Cao, et al.
用于下一代单细胞分析的大型语言模型扩展
LLM
AI for Science
Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.
基于大语言模型的氛围编码综述
LLM
Agent
Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.
通过下一位置预测检测任何内容
目标检测
多模态
Qing Jiang, Junan Huo, Xingyu Chen, et al.
面向语言中心的多模态表征学习的扩展
多模态表征
统一多模态
Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.
DITING:用于基准测试网络小说翻译的多Agent评估框架
翻译
LLM
Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.
通过自监督预训练推进端到端像素空间生成建模
扩散模型
图像生成
Jiachen Lei, Keli Liu, Julius Berner, et al.
空间强制:面向视觉-语言-动作模型的隐式空间表征对齐
多模态
多模态表征
Fuhao Li, Wenxuan Song, Han Zhao, et al.
基于大型语言模型的偏好获取中的澄清性问题提问
偏好
LLM
Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.
CTRL-Rec:通过自然语言控制推荐系统
偏好
自然语言处理
Micah Carroll, Adeline Foote, Kevin Feng, et al.
RLFR:通过流环境扩展用于LLM的强化学习
强化学习
LLM
Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.
潜在精炼解码:通过精炼信念状态增强基于扩散的LLM
扩散模型
文本生成
Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.
OmniVideoBench:面向全景多模态大模型的音视频理解评估
视频理解
多模态
Caorui Li, Yu Chen, Yiyan Ji, et al.
BEAR:面向原子化具身能力的多模态语言模型基准测试与增强
Agent
基准
Yu Qi, Haibo Zhao, Ziyu Guo, et al.
1
20
21
22
23
24
25
26
48
基于指令的视频编辑的规模化:高质量合成数据集
统一多模态
合成
Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.
OmniVinci:提升架构与数据以实现全模态理解 LLM
多模态表征
统一多模态
Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.
关于LLM推理中内部概率与自洽性衔接的理论研究
推理
LLM
Zhi Zhou, Yuhao Tan, Zenan Li, et al.
DeepSeek-OCR:上下文光学压缩
OCR
LLM
Haoran Wei, Yaofeng Sun, Yukun Li
带有未观测偏好异质性的直接偏好优化:三元偏好必要性
偏好
LLM
Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis
用于概率天气预报的滚动扩散模型阐释
扩散模型
深度学习
Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.
图像搜索:超越语义依赖约束的视频生成自适应测试时搜索
统一多模态
文生视频
Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.
从像素到文字——迈向大规模原生视觉-语言原子单元
多模态
多模态表征
Haiwen Diao, Mingxuan Li, Silei Wu, et al.
面向服务的AI:通过AI眼镜实现主动辅助
Agent
多模态
Zichen Wen, Yiyu Wang, Chenfei Liao, et al.
WithAnyone:迈向可控且ID一致的图像生成
文生图
图像生成
Hengyuan Xu, Wei Cheng, Peng Xing, et al.
代理熵平衡策略优化
强化学习
Agent
Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.
当模型说谎时,我们得以学习:基于PsiloQA的多语言跨度级幻觉检测
数据集
LLM
Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.
基于深度学习预测多模板PCR中的序列特异性扩增效率
深度学习
卷积神经网络
Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.
基因组分析工具:一种用于分析下一代DNA测序数据的MapReduce框架
基因组学
高性能计算
Aaron McKenna, Matthew Hanna, Eric Banks, et al.
LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具
建模
高性能计算
Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.
LabOS:能够感知并协同人类的AI-XR共科研人员
Le Cong, Zaixi Zhang, Xiaotong Wang, et al.
海豚:基于异构锚点提示的文档图像解析
文档理解
多模态
Hao Feng, Shu Wei, Xiang Fei, et al.
LiveCC:基于大规模流式语音转录学习视频LLM
LLM
视觉问答
Joya Chen, Ziyun Zeng, Yiqi Lin, et al.
DeepMMSearch-R1:赋能多模态LLM在多模态网络搜索中的应用
视觉问答
检索增强生成
Kartik Narayan, Yang Xu, Tian Cao, et al.
用于下一代单细胞分析的大型语言模型扩展
LLM
AI for Science
Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.
基于大语言模型的氛围编码综述
LLM
Agent
Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.
通过下一位置预测检测任何内容
目标检测
多模态
Qing Jiang, Junan Huo, Xingyu Chen, et al.
面向语言中心的多模态表征学习的扩展
多模态表征
统一多模态
Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.
DITING:用于基准测试网络小说翻译的多Agent评估框架
翻译
LLM
Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.
通过自监督预训练推进端到端像素空间生成建模
扩散模型
图像生成
Jiachen Lei, Keli Liu, Julius Berner, et al.
空间强制:面向视觉-语言-动作模型的隐式空间表征对齐
多模态
多模态表征
Fuhao Li, Wenxuan Song, Han Zhao, et al.
基于大型语言模型的偏好获取中的澄清性问题提问
偏好
LLM
Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.
CTRL-Rec:通过自然语言控制推荐系统
偏好
自然语言处理
Micah Carroll, Adeline Foote, Kevin Feng, et al.
RLFR:通过流环境扩展用于LLM的强化学习
强化学习
LLM
Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.
潜在精炼解码:通过精炼信念状态增强基于扩散的LLM
扩散模型
文本生成
Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.
OmniVideoBench:面向全景多模态大模型的音视频理解评估
视频理解
多模态
Caorui Li, Yu Chen, Yiyan Ji, et al.
BEAR:面向原子化具身能力的多模态语言模型基准测试与增强
Agent
基准
Yu Qi, Haibo Zhao, Ziyu Guo, et al.
1
20
21
22
23
24
25
26
48