HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
语言模型Agent的赋能估计
Jinyeop Song, Jeff Gore, Max Kleiman-Weiner
语言模型可以在没有标量奖励的情况下从口头反馈中学习
Renjie Luo, Zichen Liu, Xiangyan Liu, et al.
语言模型的变分推理
Xiangxin Zhou, Zichen Liu, Haonan Wang, et al.
EPO:面向LLM Agent的熵正则化策略优化 强化学习
Xu Wujiang, Wentian Zhao, Zhenting Wang, et al.
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型
Junbo Niu, Zheng Liu, Zhuangcheng Gu, et al.
分位数优势估计用于熵安全推理
Junkang Wu, Kexin Huang, Jiancan Wu, et al.
LongLive:实时交互式长视频生成
Shuai Yang, Wei Huang, Ruihang Chu, et al.
组合式创造力:泛化能力的新前沿
Samuel Schapiro, Sumuk Shashidhar, Alexi Gladstone, et al.
因果时空预测:一种高效且有效的多模态方法
Yuting Huang, Ziquan Fang, Zhihao Zeng, et al.
Hunyuan3D-Omni:一种用于可控生成3D资产的统一框架
Team Hunyuan3D, Bowen Zhang, Chunchao Guo, et al.
Seedream 4.0:迈向下一代多模态图像生成
Team Seedream, Yunpeng Chen, Yu Gao, et al.
LLM Agent强化学习中的树搜索
Yuxiang Ji, Ziyu Ma, Yong Wang, et al.
SciReasoner:跨学科奠定科学推理基础
Yizhou Wang, Chen Tang, Han Deng, et al.
MMR1:通过方差感知采样与开放资源增强多模态推理
Sicong Leng, Jing Wang, Jiaxi Li, et al.
基于方差的课程强化学习用于大语言模型
Guochao Jiang, Wenfeng Feng, Guofeng Quan, et al.
MultiEdit:在多样且具有挑战性的任务上推进基于指令的图像编辑
Mingsong Li, Lin Liu, Hongjun Wang, et al.
BRISC:基于Swin-HAFNet的脑肿瘤分割与分类标注数据集
Amirreza Fateh, Yasin Rezvani, Sara Moayedi, et al.
FDABench:面向异构数据上分析查询的数据Agent基准测试
Ziting Wang, Shize Zhang, Haitao Yuan, et al.
作画易,思辨难:文本到图像模型能否铺就舞台,却无法主导演出?
Ouxiang Li, Yuan Wang, Xinting Hu, et al.
UniVerse-1:通过专家拼接实现统一的音视频生成
Duomin Wang, Wei Zuo, Aojie Li, et al.
基础模型在逐步具身推理中的表现如何?
Dinura Dissanayake, Ahmed Heakl, Omkar Thawakar, et al.
脉冲脑技术报告:脉冲脑启发的大规模模型
Yuqi Pan, Yupeng Feng, Jinghao Zhuang, et al.
SAGE:语义理解的现实基准
Samarth Goel, Reagan J. Lee, Kannan Ramchandran
WAVECLIP:小波Token化用于自适应分辨率CLIP
Moshe Kimhi, Erez Koifman, Ehud Rivlin, et al.
EmbeddingGemma:强大且轻量的文本表示
Henrique Schechter Vera, Sahil Dua, Biao Zhang, et al.
通过GRPO提升语音感知语言模型中的语音理解能力
Avishai Elmakies, Hagai Aronowitz, Nimrod Shabtay, et al.
VLMs 距离视觉空间智能还有多远?一项基准驱动的视角
Songsong Yu, Yuxin Chen, Hao Ju, et al.
SIM-CoT:监督式隐式思维链
Xilin Wei, Xiaoran Liu, Yuhang Zang, et al.
SWE-QA:语言模型能否回答仓库级代码问题?
Weihan Peng, Yuling Shi, Yuhang Wang, et al.
视频模型是零样本学习者和推理者
Thaddäus Wiedemer, Yuxuan Li, Paul Vicol, et al.
用于机械工程分析问题关键求解的N-Plus-1 GPT Agent
Anthony Patera, Rohan Abeyaratne
Memory-QA:基于多模态记忆的回忆问答
Hongda Jiang, Xinyuan Zhang, Siddhant Garg, et al.
1
12
13
14
15
16
17
18
37
语言模型Agent的赋能估计
Jinyeop Song, Jeff Gore, Max Kleiman-Weiner
语言模型可以在没有标量奖励的情况下从口头反馈中学习
Renjie Luo, Zichen Liu, Xiangyan Liu, et al.
语言模型的变分推理
Xiangxin Zhou, Zichen Liu, Haonan Wang, et al.
EPO:面向LLM Agent的熵正则化策略优化 强化学习
Xu Wujiang, Wentian Zhao, Zhenting Wang, et al.
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型
Junbo Niu, Zheng Liu, Zhuangcheng Gu, et al.
分位数优势估计用于熵安全推理
Junkang Wu, Kexin Huang, Jiancan Wu, et al.
LongLive:实时交互式长视频生成
Shuai Yang, Wei Huang, Ruihang Chu, et al.
组合式创造力:泛化能力的新前沿
Samuel Schapiro, Sumuk Shashidhar, Alexi Gladstone, et al.
因果时空预测:一种高效且有效的多模态方法
Yuting Huang, Ziquan Fang, Zhihao Zeng, et al.
Hunyuan3D-Omni:一种用于可控生成3D资产的统一框架
Team Hunyuan3D, Bowen Zhang, Chunchao Guo, et al.
Seedream 4.0:迈向下一代多模态图像生成
Team Seedream, Yunpeng Chen, Yu Gao, et al.
LLM Agent强化学习中的树搜索
Yuxiang Ji, Ziyu Ma, Yong Wang, et al.
SciReasoner:跨学科奠定科学推理基础
Yizhou Wang, Chen Tang, Han Deng, et al.
MMR1:通过方差感知采样与开放资源增强多模态推理
Sicong Leng, Jing Wang, Jiaxi Li, et al.
基于方差的课程强化学习用于大语言模型
Guochao Jiang, Wenfeng Feng, Guofeng Quan, et al.
MultiEdit:在多样且具有挑战性的任务上推进基于指令的图像编辑
Mingsong Li, Lin Liu, Hongjun Wang, et al.
BRISC:基于Swin-HAFNet的脑肿瘤分割与分类标注数据集
Amirreza Fateh, Yasin Rezvani, Sara Moayedi, et al.
FDABench:面向异构数据上分析查询的数据Agent基准测试
Ziting Wang, Shize Zhang, Haitao Yuan, et al.
作画易,思辨难:文本到图像模型能否铺就舞台,却无法主导演出?
Ouxiang Li, Yuan Wang, Xinting Hu, et al.
UniVerse-1:通过专家拼接实现统一的音视频生成
Duomin Wang, Wei Zuo, Aojie Li, et al.
基础模型在逐步具身推理中的表现如何?
Dinura Dissanayake, Ahmed Heakl, Omkar Thawakar, et al.
脉冲脑技术报告:脉冲脑启发的大规模模型
Yuqi Pan, Yupeng Feng, Jinghao Zhuang, et al.
SAGE:语义理解的现实基准
Samarth Goel, Reagan J. Lee, Kannan Ramchandran
WAVECLIP:小波Token化用于自适应分辨率CLIP
Moshe Kimhi, Erez Koifman, Ehud Rivlin, et al.
EmbeddingGemma:强大且轻量的文本表示
Henrique Schechter Vera, Sahil Dua, Biao Zhang, et al.
通过GRPO提升语音感知语言模型中的语音理解能力
Avishai Elmakies, Hagai Aronowitz, Nimrod Shabtay, et al.
VLMs 距离视觉空间智能还有多远?一项基准驱动的视角
Songsong Yu, Yuxin Chen, Hao Ju, et al.
SIM-CoT:监督式隐式思维链
Xilin Wei, Xiaoran Liu, Yuhang Zang, et al.
SWE-QA:语言模型能否回答仓库级代码问题?
Weihan Peng, Yuling Shi, Yuhang Wang, et al.
视频模型是零样本学习者和推理者
Thaddäus Wiedemer, Yuxuan Li, Paul Vicol, et al.
用于机械工程分析问题关键求解的N-Plus-1 GPT Agent
Anthony Patera, Rohan Abeyaratne
Memory-QA:基于多模态记忆的回忆问答
Hongda Jiang, Xinyuan Zhang, Siddhant Garg, et al.
1
12
13
14
15
16
17
18
37