HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
多样性是否足以实现可扩展的机器人操作?
统一多模态
多任务学习
Modi Shi, Li Chen, Jin Chen, et al.
Nile-Chat:用于阿拉伯文和拉丁字母的埃及语言模型
LLM
文本生成
Guokan Shang, Hadi Abdine, Ahmad Chamma, et al.
GTA1:GUI 测试时缩放代理
Agent
人机交互
Yan Yang, Dongxu Li, Yutong Dai, et al.
MedGen:通过扩展细粒度标注的医学视频来解锁医学视频生成
视频生成
文生视频
Rongsheng Wang, Junying Chen, Ke Ji, et al.
RLVER:具有可验证情感奖励的强化学习用于共情代理
基准
Agent
Peisong Wang, Ruotian Ma, Bang Zhang, et al.
以用户为中心的地理体验:一种基于大型语言模型的增强规划、导航和动态适应框架
检索增强生成
LLM
Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.
PLAME:利用预训练语言模型生成增强的蛋白质多序列比对
Transformer
自然语言处理
Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.
CriticLean:基于批评家指导的强化学习用于数学形式化
基准
监督式微调
Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.
StreamVLN:通过SlowFast上下文建模实现流式视觉-语言导航
LLM
多模态
Meng Wei, Chenyang Wan, Xiqian Yu, et al.
OmniPart:具有语义解耦和结构凝聚意识的3D生成
3D 生成
统一多模态
Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.
SingLoRA:使用单矩阵的低秩适应
LLM
Transformer
David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.
潜在推理综述
LLM
推理
Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.
Agent KB:利用跨领域经验解决代理问题
Agent
推理
Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.
基于人类反馈的强化学习训练有益且无害的助手
偏好
强化学习
Yuntao Bai, Andy Jones, Kamal Ndousse, et al.
ChipSeek-R1:通过分层奖励驱动的强化学习生成超越人类的RTL
LLM
模型训练
Zhirong Chen, Kaiyan Chang, Zhuolin Li, et al.
MedGemma 技术报告
统一多模态
视觉问答
Andrew Sellergren, Sahar Kazemzadeh, Tiam Jaroensri, et al.
BMMR:大规模双语多模态多学科推理数据集
多模态
数据集
Zhiheng Xi, Guanyu Li, Yutao Fan, et al.
预训练策略判别器是通用奖励模型
偏好
模型训练
Shihan Dou, Shichun Liu, Yuming Yang, et al.
DreamVLA:一个融合全面世界知识的视觉-语言-行动模型
统一多模态
机器人技术
Wenyao Zhang, Hongsi Liu, Zekun Qi, et al.
4DSloMo:异步捕捉下的高速场景四维重建
机器视觉 3D
视频处理
Yutian Chen, Shi Guo, Tianshuo Yang, et al.
我们是否仍应使用掩码语言模型对编码器进行预训练?
自然语言处理
Transformer
Hippolyte Gisserot-Boukhlef, Nicolas Boizard, Manuel Faysse, et al.
MemOS:一种用于AI系统的内存操作系统
LLM
检索增强生成
Zhiyu Li, Shichao Song, Chenyang Xi, et al.
OGF:一种用于优化非定常湍流统计稳态时间平均值的在线梯度流方法
AI for Science
高性能计算
Tom Hickling, Jonathan F. MacArt, Justin Sirignano, et al.
OpenS2S:推进开源端到端共情大语言模型
语音生成
音频和语音处理
Chen Wang, Tianyu Peng, Wen Yang, et al.
Point3R:具有显式空间指针内存的流式3D重建
机器视觉 3D
深度估计
Yuqi Wu, Wenzhao Zheng, Jie Zhou, et al.
多级逐步提示增强强化学习推理能力
强化学习
LLM
Kaiyi Zhang, Ang Lv, Jinpeng Li, et al.
建立构建严谨能动性基准的最佳实践
基准
Agent
Yuxuan Zhu, Tengjun Jin, Yada Pruksachatkun, et al.
GPT-4o 对视觉理解得如何?评估多模态基础模型在标准计算机视觉任务上的表现
图像识别
图像分类
Rahul Ramachandran, Ali Garjani, Roman Bachmann, et al.
Eka-Eval:印度语言大型语言模型的综合评估框架
基准
LLM
Samridhi Raj Sinha, Rajvee Sheth, Abhishek Upperwal, et al.
DynamiCare:一种动态多智能体框架用于交互式和开放式医疗决策制定
Agent
LLM
Tianqi Shang, Weiqing He, Charles Zheng, et al.
基于能量的 Transformer 是可扩展的学习者和思考者
Transformer
计算机视觉
Alexi Gladstone, Ganesh Nanduru, Md Mofijul Islam, et al.
IntFold:一种可控的基础模型用于通用和专业的生物分子结构预测
Transformer
生物分子
The IntFold Team, Leon Qiao, Wayne Bai, et al.
1
40
41
42
43
44
45
46
48
多样性是否足以实现可扩展的机器人操作?
统一多模态
多任务学习
Modi Shi, Li Chen, Jin Chen, et al.
Nile-Chat:用于阿拉伯文和拉丁字母的埃及语言模型
LLM
文本生成
Guokan Shang, Hadi Abdine, Ahmad Chamma, et al.
GTA1:GUI 测试时缩放代理
Agent
人机交互
Yan Yang, Dongxu Li, Yutong Dai, et al.
MedGen:通过扩展细粒度标注的医学视频来解锁医学视频生成
视频生成
文生视频
Rongsheng Wang, Junying Chen, Ke Ji, et al.
RLVER:具有可验证情感奖励的强化学习用于共情代理
基准
Agent
Peisong Wang, Ruotian Ma, Bang Zhang, et al.
以用户为中心的地理体验:一种基于大型语言模型的增强规划、导航和动态适应框架
检索增强生成
LLM
Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.
PLAME:利用预训练语言模型生成增强的蛋白质多序列比对
Transformer
自然语言处理
Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.
CriticLean:基于批评家指导的强化学习用于数学形式化
基准
监督式微调
Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.
StreamVLN:通过SlowFast上下文建模实现流式视觉-语言导航
LLM
多模态
Meng Wei, Chenyang Wan, Xiqian Yu, et al.
OmniPart:具有语义解耦和结构凝聚意识的3D生成
3D 生成
统一多模态
Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.
SingLoRA:使用单矩阵的低秩适应
LLM
Transformer
David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.
潜在推理综述
LLM
推理
Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.
Agent KB:利用跨领域经验解决代理问题
Agent
推理
Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.
基于人类反馈的强化学习训练有益且无害的助手
偏好
强化学习
Yuntao Bai, Andy Jones, Kamal Ndousse, et al.
ChipSeek-R1:通过分层奖励驱动的强化学习生成超越人类的RTL
LLM
模型训练
Zhirong Chen, Kaiyan Chang, Zhuolin Li, et al.
MedGemma 技术报告
统一多模态
视觉问答
Andrew Sellergren, Sahar Kazemzadeh, Tiam Jaroensri, et al.
BMMR:大规模双语多模态多学科推理数据集
多模态
数据集
Zhiheng Xi, Guanyu Li, Yutao Fan, et al.
预训练策略判别器是通用奖励模型
偏好
模型训练
Shihan Dou, Shichun Liu, Yuming Yang, et al.
DreamVLA:一个融合全面世界知识的视觉-语言-行动模型
统一多模态
机器人技术
Wenyao Zhang, Hongsi Liu, Zekun Qi, et al.
4DSloMo:异步捕捉下的高速场景四维重建
机器视觉 3D
视频处理
Yutian Chen, Shi Guo, Tianshuo Yang, et al.
我们是否仍应使用掩码语言模型对编码器进行预训练?
自然语言处理
Transformer
Hippolyte Gisserot-Boukhlef, Nicolas Boizard, Manuel Faysse, et al.
MemOS:一种用于AI系统的内存操作系统
LLM
检索增强生成
Zhiyu Li, Shichao Song, Chenyang Xi, et al.
OGF:一种用于优化非定常湍流统计稳态时间平均值的在线梯度流方法
AI for Science
高性能计算
Tom Hickling, Jonathan F. MacArt, Justin Sirignano, et al.
OpenS2S:推进开源端到端共情大语言模型
语音生成
音频和语音处理
Chen Wang, Tianyu Peng, Wen Yang, et al.
Point3R:具有显式空间指针内存的流式3D重建
机器视觉 3D
深度估计
Yuqi Wu, Wenzhao Zheng, Jie Zhou, et al.
多级逐步提示增强强化学习推理能力
强化学习
LLM
Kaiyi Zhang, Ang Lv, Jinpeng Li, et al.
建立构建严谨能动性基准的最佳实践
基准
Agent
Yuxuan Zhu, Tengjun Jin, Yada Pruksachatkun, et al.
GPT-4o 对视觉理解得如何?评估多模态基础模型在标准计算机视觉任务上的表现
图像识别
图像分类
Rahul Ramachandran, Ali Garjani, Roman Bachmann, et al.
Eka-Eval:印度语言大型语言模型的综合评估框架
基准
LLM
Samridhi Raj Sinha, Rajvee Sheth, Abhishek Upperwal, et al.
DynamiCare:一种动态多智能体框架用于交互式和开放式医疗决策制定
Agent
LLM
Tianqi Shang, Weiqing He, Charles Zheng, et al.
基于能量的 Transformer 是可扩展的学习者和思考者
Transformer
计算机视觉
Alexi Gladstone, Ganesh Nanduru, Md Mofijul Islam, et al.
IntFold:一种可控的基础模型用于通用和专业的生物分子结构预测
Transformer
生物分子
The IntFold Team, Leon Qiao, Wayne Bai, et al.
1
40
41
42
43
44
45
46
48