HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

基于指令的视频编辑的规模化：高质量合成数据集

基于指令的视频编辑的规模化：高质量合成数据集

统一多模态

Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.

OmniVinci：提升架构与数据以实现全模态理解 LLM

OmniVinci：提升架构与数据以实现全模态理解 LLM

多模态表征

统一多模态

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

关于LLM推理中内部概率与自洽性衔接的理论研究

关于LLM推理中内部概率与自洽性衔接的理论研究

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

DeepSeek-OCR：上下文光学压缩

DeepSeek-OCR：上下文光学压缩

Haoran Wei, Yaofeng Sun, Yukun Li

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

用于概率天气预报的滚动扩散模型阐释

用于概率天气预报的滚动扩散模型阐释

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

统一多模态

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

从像素到文字——迈向大规模原生视觉-语言原子单元

从像素到文字——迈向大规模原生视觉-语言原子单元

多模态表征

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

面向服务的AI：通过AI眼镜实现主动辅助

面向服务的AI：通过AI眼镜实现主动辅助

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone：迈向可控且ID一致的图像生成

WithAnyone：迈向可控且ID一致的图像生成

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

代理熵平衡策略优化

代理熵平衡策略优化

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

基于深度学习预测多模板PCR中的序列特异性扩增效率

基于深度学习预测多模板PCR中的序列特异性扩增效率

卷积神经网络

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

高性能计算

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

高性能计算

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

LabOS：能够感知并协同人类的AI-XR共科研人员

LabOS：能够感知并协同人类的AI-XR共科研人员

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

海豚：基于异构锚点提示的文档图像解析

海豚：基于异构锚点提示的文档图像解析

Hao Feng, Shu Wei, Xiang Fei, et al.

LiveCC：基于大规模流式语音转录学习视频LLM

LiveCC：基于大规模流式语音转录学习视频LLM

Joya Chen, Ziyun Zeng, Yiqi Lin, et al.

DeepMMSearch-R1：赋能多模态LLM在多模态网络搜索中的应用

DeepMMSearch-R1：赋能多模态LLM在多模态网络搜索中的应用

检索增强生成

Kartik Narayan, Yang Xu, Tian Cao, et al.

用于下一代单细胞分析的大型语言模型扩展

用于下一代单细胞分析的大型语言模型扩展

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

基于大语言模型的氛围编码综述

基于大语言模型的氛围编码综述

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

通过下一位置预测检测任何内容

通过下一位置预测检测任何内容

Qing Jiang, Junan Huo, Xingyu Chen, et al.

面向语言中心的多模态表征学习的扩展

面向语言中心的多模态表征学习的扩展

多模态表征

统一多模态

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING：用于基准测试网络小说翻译的多Agent评估框架

DITING：用于基准测试网络小说翻译的多Agent评估框架

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

通过自监督预训练推进端到端像素空间生成建模

通过自监督预训练推进端到端像素空间生成建模

Jiachen Lei, Keli Liu, Julius Berner, et al.

空间强制：面向视觉-语言-动作模型的隐式空间表征对齐

空间强制：面向视觉-语言-动作模型的隐式空间表征对齐

多模态表征

Fuhao Li, Wenxuan Song, Han Zhao, et al.

基于大型语言模型的偏好获取中的澄清性问题提问

基于大型语言模型的偏好获取中的澄清性问题提问

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec：通过自然语言控制推荐系统

CTRL-Rec：通过自然语言控制推荐系统

自然语言处理

Micah Carroll, Adeline Foote, Kevin Feng, et al.

RLFR：通过流环境扩展用于LLM的强化学习

RLFR：通过流环境扩展用于LLM的强化学习

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

潜在精炼解码：通过精炼信念状态增强基于扩散的LLM

潜在精炼解码：通过精炼信念状态增强基于扩散的LLM

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

OmniVideoBench：面向全景多模态大模型的音视频理解评估

OmniVideoBench：面向全景多模态大模型的音视频理解评估

Caorui Li, Yu Chen, Yiyan Ji, et al.

BEAR：面向原子化具身能力的多模态语言模型基准测试与增强

BEAR：面向原子化具身能力的多模态语言模型基准测试与增强

Yu Qi, Haibo Zhao, Ziyu Guo, et al.

基于指令的视频编辑的规模化：高质量合成数据集

基于指令的视频编辑的规模化：高质量合成数据集

统一多模态

Qingyan Bai, Qiuyu Wang, Hao Ouyang, et al.

OmniVinci：提升架构与数据以实现全模态理解 LLM

OmniVinci：提升架构与数据以实现全模态理解 LLM

多模态表征

统一多模态

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

关于LLM推理中内部概率与自洽性衔接的理论研究

关于LLM推理中内部概率与自洽性衔接的理论研究

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

DeepSeek-OCR：上下文光学压缩

DeepSeek-OCR：上下文光学压缩

Haoran Wei, Yaofeng Sun, Yukun Li

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

用于概率天气预报的滚动扩散模型阐释

用于概率天气预报的滚动扩散模型阐释

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

统一多模态

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

从像素到文字——迈向大规模原生视觉-语言原子单元

从像素到文字——迈向大规模原生视觉-语言原子单元

多模态表征

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

面向服务的AI：通过AI眼镜实现主动辅助

面向服务的AI：通过AI眼镜实现主动辅助

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

WithAnyone：迈向可控且ID一致的图像生成

WithAnyone：迈向可控且ID一致的图像生成

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

代理熵平衡策略优化

代理熵平衡策略优化

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

基于深度学习预测多模板PCR中的序列特异性扩增效率

基于深度学习预测多模板PCR中的序列特异性扩增效率

卷积神经网络

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

高性能计算

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

高性能计算

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

LabOS：能够感知并协同人类的AI-XR共科研人员

LabOS：能够感知并协同人类的AI-XR共科研人员

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

海豚：基于异构锚点提示的文档图像解析

海豚：基于异构锚点提示的文档图像解析

Hao Feng, Shu Wei, Xiang Fei, et al.

LiveCC：基于大规模流式语音转录学习视频LLM

LiveCC：基于大规模流式语音转录学习视频LLM

Joya Chen, Ziyun Zeng, Yiqi Lin, et al.

DeepMMSearch-R1：赋能多模态LLM在多模态网络搜索中的应用

DeepMMSearch-R1：赋能多模态LLM在多模态网络搜索中的应用

检索增强生成

Kartik Narayan, Yang Xu, Tian Cao, et al.

用于下一代单细胞分析的大型语言模型扩展

用于下一代单细胞分析的大型语言模型扩展

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

基于大语言模型的氛围编码综述

基于大语言模型的氛围编码综述

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

通过下一位置预测检测任何内容

通过下一位置预测检测任何内容

Qing Jiang, Junan Huo, Xingyu Chen, et al.

面向语言中心的多模态表征学习的扩展

面向语言中心的多模态表征学习的扩展

多模态表征

统一多模态

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING：用于基准测试网络小说翻译的多Agent评估框架

DITING：用于基准测试网络小说翻译的多Agent评估框架

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

通过自监督预训练推进端到端像素空间生成建模

通过自监督预训练推进端到端像素空间生成建模

Jiachen Lei, Keli Liu, Julius Berner, et al.

空间强制：面向视觉-语言-动作模型的隐式空间表征对齐

空间强制：面向视觉-语言-动作模型的隐式空间表征对齐

多模态表征

Fuhao Li, Wenxuan Song, Han Zhao, et al.

基于大型语言模型的偏好获取中的澄清性问题提问

基于大型语言模型的偏好获取中的澄清性问题提问

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec：通过自然语言控制推荐系统

CTRL-Rec：通过自然语言控制推荐系统

自然语言处理

Micah Carroll, Adeline Foote, Kevin Feng, et al.

RLFR：通过流环境扩展用于LLM的强化学习

RLFR：通过流环境扩展用于LLM的强化学习

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

潜在精炼解码：通过精炼信念状态增强基于扩散的LLM

潜在精炼解码：通过精炼信念状态增强基于扩散的LLM

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

OmniVideoBench：面向全景多模态大模型的音视频理解评估

OmniVideoBench：面向全景多模态大模型的音视频理解评估

Caorui Li, Yu Chen, Yiyan Ji, et al.

BEAR：面向原子化具身能力的多模态语言模型基准测试与增强

BEAR：面向原子化具身能力的多模态语言模型基准测试与增强

Yu Qi, Haibo Zhao, Ziyu Guo, et al.