HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务条款隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
论文

论文

每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集支持

产品

报道教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

Meteor：基于Mamba的大型语言与视觉模型推理路径遍历

Meteor：基于Mamba的大型语言与视觉模型推理路径遍历

Byung-Kwan Lee, Chae Won Kim, Beomchan Park, et al.

FIFO-Diffusion：无需训练从文本生成无限视频

FIFO-Diffusion：无需训练从文本生成无限视频

Jihwan Kim, Junoh Kang, Jinyoung Choi, et al.

我们距离GPT-4V还有多远？通过开源套件缩小与商业多模态模型的差距

我们距离GPT-4V还有多远？通过开源套件缩小与商业多模态模型的差距

Zhe Chen, Weiyun Wang, Hao Tian, et al.

通过想象、搜索与批判实现LLM的自我改进

通过想象、搜索与批判实现LLM的自我改进

Ye Tian, Baolin Peng, Linfeng Song, et al.

OmniFusion 技术报告

OmniFusion 技术报告

统一多模态

Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.

机器学习预测误差优于DFT精度

机器学习预测误差优于DFT精度

Felix A. Faber, Luke Hutchison, Bing Huang, et al.

SEAgent：具备从经验中自主学习能力的自演化计算机使用代理

SEAgent：具备从经验中自主学习能力的自演化计算机使用代理

统一多模态

Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.

AMix-1：通往测试时可扩展蛋白质基础模型的路径

AMix-1：通往测试时可扩展蛋白质基础模型的路径

Changze Lv, Jiang Zhou, Siyu Long, et al.

CRINN：用于近似最近邻搜索的对比强化学习

CRINN：用于近似最近邻搜索的对比强化学习

检索增强生成

Xiaoya Li, Xiaofei Sun, Albert Wang, et al.

表示偏移：统一令牌压缩与FlashAttention

表示偏移：统一令牌压缩与FlashAttention

Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.

CompassVerifier：一种统一且鲁棒的LLM评估与结果奖励验证器

CompassVerifier：一种统一且鲁棒的LLM评估与结果奖励验证器

Shudong Liu, Hongwei Liu, Junnan Liu, et al.

LongVie：多模态引导的可控超长视频生成

LongVie：多模态引导的可控超长视频生成

Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.

Skywork UniPic：面向视觉理解与生成的统一自回归建模

Skywork UniPic：面向视觉理解与生成的统一自回归建模

Peiyu Wang, Yi Peng, Yimeng Gan, et al.

Seed Diffusion：一种具备高速推理能力的大规模扩散语言模型

Seed Diffusion：一种具备高速推理能力的大规模扩散语言模型

\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.

Agent Lightning：使用强化学习训练任意AI Agent

Agent Lightning：使用强化学习训练任意AI Agent

Xufang Luo, Yuge Zhang, Zhiyuan He, et al.

基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现

基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现

He Wang, Liang Zeng

超越权衡：用于推理模型指令遵循的自监督强化学习

超越权衡：用于推理模型指令遵循的自监督强化学习

Qingyu Ren, Qianyu He, Bowei Zhang, et al.

Llama-3.1-基础AI安全LLM-8B-指令技术报告

Llama-3.1-基础AI安全LLM-8B-指令技术报告

监督式微调

Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.

CellForge：虚拟细胞模型的智能体设计

CellForge：虚拟细胞模型的智能体设计

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.

SitEmb-v1.5：面向语义关联与长故事理解的改进型上下文感知密集检索

SitEmb-v1.5：面向语义关联与长故事理解的改进型上下文感知密集检索

检索增强生成

Junjie Wu, Jiangnan Li, Yuqing Li, et al.

RL-PLUS：基于混合策略优化的LLM强化学习能力边界坍塌对抗方法

RL-PLUS：基于混合策略优化的LLM强化学习能力边界坍塌对抗方法

Yihong Dong, Xue Jiang, Yongding Tao, et al.

GS-Occ3D：基于高斯点阵的纯视觉占据重建扩展

GS-Occ3D：基于高斯点阵的纯视觉占据重建扩展

机器视觉 3D

Baijun Ye, Minghui Qin, Saining Zhang, et al.

SWE-Debate：用于软件问题解决的竞争性多Agent辩论

SWE-Debate：用于软件问题解决的竞争性多Agent辩论

Han Li, Yuling Shi, Shaoxin Lin, et al.

多模态指代分割：一项综述

多模态指代分割：一项综述

多模态表征

Henghui Ding, Song Tang, Shuting He, et al.

3D-R1：提升3D VLMs中的推理能力以实现统一场景理解

3D-R1：提升3D VLMs中的推理能力以实现统一场景理解

Ting Huang, Zeyu Zhang, Hao Tang

SWE-Exp：基于经验的软件问题解决

SWE-Exp：基于经验的软件问题解决

Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.

PixNerd：像素神经场扩散

PixNerd：像素神经场扩散

Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.

超越固定长度：用于扩散大语言模型的可变长度去噪

超越固定长度：用于扩散大语言模型的可变长度去噪

Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.

认知内核-Pro：面向深度研究Agent与Agent基础模型训练的框架

认知内核-Pro：面向深度研究Agent与Agent基础模型训练的框架

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.

协同生成人工智能：迈向增强型、参与式的生命周期

协同生成人工智能：迈向增强型、参与式的生命周期

Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.

iLRM：一种迭代式大规模3D重建模型

iLRM：一种迭代式大规模3D重建模型

Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.

villa-X：提升视觉-语言-动作模型中的潜在动作建模

villa-X：提升视觉-语言-动作模型中的潜在动作建模

机器人技术

Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.

Meteor：基于Mamba的大型语言与视觉模型推理路径遍历

Meteor：基于Mamba的大型语言与视觉模型推理路径遍历

Byung-Kwan Lee, Chae Won Kim, Beomchan Park, et al.

FIFO-Diffusion：无需训练从文本生成无限视频

FIFO-Diffusion：无需训练从文本生成无限视频

Jihwan Kim, Junoh Kang, Jinyoung Choi, et al.

我们距离GPT-4V还有多远？通过开源套件缩小与商业多模态模型的差距

我们距离GPT-4V还有多远？通过开源套件缩小与商业多模态模型的差距

Zhe Chen, Weiyun Wang, Hao Tian, et al.

通过想象、搜索与批判实现LLM的自我改进

通过想象、搜索与批判实现LLM的自我改进

Ye Tian, Baolin Peng, Linfeng Song, et al.

OmniFusion 技术报告

OmniFusion 技术报告

统一多模态

Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.

机器学习预测误差优于DFT精度

机器学习预测误差优于DFT精度

Felix A. Faber, Luke Hutchison, Bing Huang, et al.

SEAgent：具备从经验中自主学习能力的自演化计算机使用代理

SEAgent：具备从经验中自主学习能力的自演化计算机使用代理

统一多模态

Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.

AMix-1：通往测试时可扩展蛋白质基础模型的路径

AMix-1：通往测试时可扩展蛋白质基础模型的路径

Changze Lv, Jiang Zhou, Siyu Long, et al.

CRINN：用于近似最近邻搜索的对比强化学习

CRINN：用于近似最近邻搜索的对比强化学习

检索增强生成

Xiaoya Li, Xiaofei Sun, Albert Wang, et al.

表示偏移：统一令牌压缩与FlashAttention

表示偏移：统一令牌压缩与FlashAttention

Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.

CompassVerifier：一种统一且鲁棒的LLM评估与结果奖励验证器

CompassVerifier：一种统一且鲁棒的LLM评估与结果奖励验证器

Shudong Liu, Hongwei Liu, Junnan Liu, et al.

LongVie：多模态引导的可控超长视频生成

LongVie：多模态引导的可控超长视频生成

Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.

Skywork UniPic：面向视觉理解与生成的统一自回归建模

Skywork UniPic：面向视觉理解与生成的统一自回归建模

Peiyu Wang, Yi Peng, Yimeng Gan, et al.

Seed Diffusion：一种具备高速推理能力的大规模扩散语言模型

Seed Diffusion：一种具备高速推理能力的大规模扩散语言模型

\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.

Agent Lightning：使用强化学习训练任意AI Agent

Agent Lightning：使用强化学习训练任意AI Agent

Xufang Luo, Yuge Zhang, Zhiyuan He, et al.

基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现

基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现

He Wang, Liang Zeng

超越权衡：用于推理模型指令遵循的自监督强化学习

超越权衡：用于推理模型指令遵循的自监督强化学习

Qingyu Ren, Qianyu He, Bowei Zhang, et al.

Llama-3.1-基础AI安全LLM-8B-指令技术报告

Llama-3.1-基础AI安全LLM-8B-指令技术报告

监督式微调

Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.

CellForge：虚拟细胞模型的智能体设计

CellForge：虚拟细胞模型的智能体设计

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.

SitEmb-v1.5：面向语义关联与长故事理解的改进型上下文感知密集检索

SitEmb-v1.5：面向语义关联与长故事理解的改进型上下文感知密集检索

检索增强生成

Junjie Wu, Jiangnan Li, Yuqing Li, et al.

RL-PLUS：基于混合策略优化的LLM强化学习能力边界坍塌对抗方法

RL-PLUS：基于混合策略优化的LLM强化学习能力边界坍塌对抗方法

Yihong Dong, Xue Jiang, Yongding Tao, et al.

GS-Occ3D：基于高斯点阵的纯视觉占据重建扩展

GS-Occ3D：基于高斯点阵的纯视觉占据重建扩展

机器视觉 3D

Baijun Ye, Minghui Qin, Saining Zhang, et al.

SWE-Debate：用于软件问题解决的竞争性多Agent辩论

SWE-Debate：用于软件问题解决的竞争性多Agent辩论

Han Li, Yuling Shi, Shaoxin Lin, et al.

多模态指代分割：一项综述

多模态指代分割：一项综述

多模态表征

Henghui Ding, Song Tang, Shuting He, et al.

3D-R1：提升3D VLMs中的推理能力以实现统一场景理解

3D-R1：提升3D VLMs中的推理能力以实现统一场景理解

Ting Huang, Zeyu Zhang, Hao Tang

SWE-Exp：基于经验的软件问题解决

SWE-Exp：基于经验的软件问题解决

Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.

PixNerd：像素神经场扩散

PixNerd：像素神经场扩散

Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.

超越固定长度：用于扩散大语言模型的可变长度去噪

超越固定长度：用于扩散大语言模型的可变长度去噪

Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.

认知内核-Pro：面向深度研究Agent与Agent基础模型训练的框架

认知内核-Pro：面向深度研究Agent与Agent基础模型训练的框架

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.

协同生成人工智能：迈向增强型、参与式的生命周期

协同生成人工智能：迈向增强型、参与式的生命周期

Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.

iLRM：一种迭代式大规模3D重建模型

iLRM：一种迭代式大规模3D重建模型

Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.

villa-X：提升视觉-语言-动作模型中的潜在动作建模

villa-X：提升视觉-语言-动作模型中的潜在动作建模

机器人技术

Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.