HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
Meteor:基于Mamba的大型语言与视觉模型推理路径遍历
视觉问答
多模态
Byung-Kwan Lee, Chae Won Kim, Beomchan Park, et al.
FIFO-Diffusion:无需训练从文本生成无限视频
扩散模型
视频生成
Jihwan Kim, Junoh Kang, Jinyoung Choi, et al.
我们距离GPT-4V还有多远?通过开源套件缩小与商业多模态模型的差距
视觉问答
文档理解
Zhe Chen, Weiyun Wang, Hao Tian, et al.
通过想象、搜索与批判实现LLM的自我改进
LLM
推理
Ye Tian, Baolin Peng, Linfeng Song, et al.
OmniFusion 技术报告
视觉问答
统一多模态
Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.
机器学习预测误差优于DFT精度
深度学习
分子网络
Felix A. Faber, Luke Hutchison, Bing Huang, et al.
SEAgent:具备从经验中自主学习能力的自演化计算机使用代理
Agent
统一多模态
Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.
AMix-1:通往测试时可扩展蛋白质基础模型的路径
AI for Science
深度学习
Changze Lv, Jiang Zhou, Siyu Long, et al.
CRINN:用于近似最近邻搜索的对比强化学习
检索增强生成
LLM
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
表示偏移:统一令牌压缩与FlashAttention
Transformer
视频处理
Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.
CompassVerifier:一种统一且鲁棒的LLM评估与结果奖励验证器
LLM
推理
Shudong Liu, Hongwei Liu, Junnan Liu, et al.
LongVie:多模态引导的可控超长视频生成
视频生成
多模态
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
Skywork UniPic:面向视觉理解与生成的统一自回归建模
文生图
图像理解
Peiyu Wang, Yi Peng, Yimeng Gan, et al.
Seed Diffusion:一种具备高速推理能力的大规模扩散语言模型
LLM
扩散模型
\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.
Agent Lightning:使用强化学习训练任意AI Agent
强化学习
LLM
Xufang Luo, Yuge Zhang, Zhiyuan He, et al.
基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现
算法
机器学习
He Wang, Liang Zeng
超越权衡:用于推理模型指令遵循的自监督强化学习
强化学习
推理
Qingyu Ren, Qianyu He, Bowei Zhang, et al.
Llama-3.1-基础AI安全LLM-8B-指令 技术报告
LLM
监督式微调
Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.
CellForge:虚拟细胞模型的智能体设计
Agent
建模
Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.
SitEmb-v1.5:面向语义关联与长故事理解的改进型上下文感知密集检索
检索增强生成
文档理解
Junjie Wu, Jiangnan Li, Yuqing Li, et al.
RL-PLUS:基于混合策略优化的LLM强化学习能力边界坍塌对抗方法
强化学习
LLM
Yihong Dong, Xue Jiang, Yongding Tao, et al.
GS-Occ3D:基于高斯点阵的纯视觉占据重建扩展
机器视觉 3D
3D 模型
Baijun Ye, Minghui Qin, Saining Zhang, et al.
SWE-Debate:用于软件问题解决的竞争性多Agent辩论
Agent
LLM
Han Li, Yuling Shi, Shaoxin Lin, et al.
多模态指代分割:一项综述
多模态
多模态表征
Henghui Ding, Song Tang, Shuting He, et al.
3D-R1:提升3D VLMs中的推理能力以实现统一场景理解
视觉问答
推理
Ting Huang, Zeyu Zhang, Hao Tang
SWE-Exp:基于经验的软件问题解决
Agent
LLM
Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.
PixNerd:像素神经场扩散
扩散模型
图像生成
Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.
超越固定长度:用于扩散大语言模型的可变长度去噪
LLM
扩散模型
Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.
认知内核-Pro:面向深度研究Agent与Agent基础模型训练的框架
Agent
LLM
Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.
协同生成人工智能:迈向增强型、参与式的生命周期
人机交互
算法
Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.
iLRM:一种迭代式大规模3D重建模型
Transformer
3D 生成
Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.
villa-X:提升视觉-语言-动作模型中的潜在动作建模
机器人技术
视频理解
Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.
1
35
36
37
38
39
40
41
48
Meteor:基于Mamba的大型语言与视觉模型推理路径遍历
视觉问答
多模态
Byung-Kwan Lee, Chae Won Kim, Beomchan Park, et al.
FIFO-Diffusion:无需训练从文本生成无限视频
扩散模型
视频生成
Jihwan Kim, Junoh Kang, Jinyoung Choi, et al.
我们距离GPT-4V还有多远?通过开源套件缩小与商业多模态模型的差距
视觉问答
文档理解
Zhe Chen, Weiyun Wang, Hao Tian, et al.
通过想象、搜索与批判实现LLM的自我改进
LLM
推理
Ye Tian, Baolin Peng, Linfeng Song, et al.
OmniFusion 技术报告
视觉问答
统一多模态
Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.
机器学习预测误差优于DFT精度
深度学习
分子网络
Felix A. Faber, Luke Hutchison, Bing Huang, et al.
SEAgent:具备从经验中自主学习能力的自演化计算机使用代理
Agent
统一多模态
Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.
AMix-1:通往测试时可扩展蛋白质基础模型的路径
AI for Science
深度学习
Changze Lv, Jiang Zhou, Siyu Long, et al.
CRINN:用于近似最近邻搜索的对比强化学习
检索增强生成
LLM
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
表示偏移:统一令牌压缩与FlashAttention
Transformer
视频处理
Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.
CompassVerifier:一种统一且鲁棒的LLM评估与结果奖励验证器
LLM
推理
Shudong Liu, Hongwei Liu, Junnan Liu, et al.
LongVie:多模态引导的可控超长视频生成
视频生成
多模态
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
Skywork UniPic:面向视觉理解与生成的统一自回归建模
文生图
图像理解
Peiyu Wang, Yi Peng, Yimeng Gan, et al.
Seed Diffusion:一种具备高速推理能力的大规模扩散语言模型
LLM
扩散模型
\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.
Agent Lightning:使用强化学习训练任意AI Agent
强化学习
LLM
Xufang Luo, Yuge Zhang, Zhiyuan He, et al.
基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现
算法
机器学习
He Wang, Liang Zeng
超越权衡:用于推理模型指令遵循的自监督强化学习
强化学习
推理
Qingyu Ren, Qianyu He, Bowei Zhang, et al.
Llama-3.1-基础AI安全LLM-8B-指令 技术报告
LLM
监督式微调
Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.
CellForge:虚拟细胞模型的智能体设计
Agent
建模
Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.
SitEmb-v1.5:面向语义关联与长故事理解的改进型上下文感知密集检索
检索增强生成
文档理解
Junjie Wu, Jiangnan Li, Yuqing Li, et al.
RL-PLUS:基于混合策略优化的LLM强化学习能力边界坍塌对抗方法
强化学习
LLM
Yihong Dong, Xue Jiang, Yongding Tao, et al.
GS-Occ3D:基于高斯点阵的纯视觉占据重建扩展
机器视觉 3D
3D 模型
Baijun Ye, Minghui Qin, Saining Zhang, et al.
SWE-Debate:用于软件问题解决的竞争性多Agent辩论
Agent
LLM
Han Li, Yuling Shi, Shaoxin Lin, et al.
多模态指代分割:一项综述
多模态
多模态表征
Henghui Ding, Song Tang, Shuting He, et al.
3D-R1:提升3D VLMs中的推理能力以实现统一场景理解
视觉问答
推理
Ting Huang, Zeyu Zhang, Hao Tang
SWE-Exp:基于经验的软件问题解决
Agent
LLM
Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.
PixNerd:像素神经场扩散
扩散模型
图像生成
Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.
超越固定长度:用于扩散大语言模型的可变长度去噪
LLM
扩散模型
Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.
认知内核-Pro:面向深度研究Agent与Agent基础模型训练的框架
Agent
LLM
Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.
协同生成人工智能:迈向增强型、参与式的生命周期
人机交互
算法
Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.
iLRM:一种迭代式大规模3D重建模型
Transformer
3D 生成
Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.
villa-X:提升视觉-语言-动作模型中的潜在动作建模
机器人技术
视频理解
Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.
1
35
36
37
38
39
40
41
48