HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
面向视角自适应的人体视频生成的3D感知隐式运动控制
视频生成
3D 生成
Zhixue Fang, Xu He, Songlin Tang, et al.
daVinci-Agency:高效解锁长周期代理数据
LLM
监督式微调
Mohan Jiang, Dayuan Fu, Junhao Shi, et al.
世界模型的研究并不仅仅是将世界知识注入特定任务中
建模
具身智能
Bohan Zeng, Kaixin Zhu, Daili Hua, et al.
AOrchestra:面向智能体编排的子智能体自动生成
Agent
智能问答
Jianhao Ruan, Zhihao Xu, Yiran Peng, et al.
思维链中缺乏全局规划:揭示LLM的潜在规划时域
LLM
推理
Liyan Xu, Mo Yu, Fandong Meng, et al.
CodeOCR:视觉语言模型在代码理解中的有效性研究
多模态
OCR
Yuling Shi, Chaoxiang Xie, Zhensu Sun, et al.
DeepPlanning:基于可验证约束的长时域Agent规划基准测试
LLM
智能问答
Yinger Zhang, Shutong Jiang, Renhao Li, et al.
CL-bench:上下文学习基准
LLM
智能问答
Shihan Dou, Ming Zhang, Zhangyue Yin, et al.
基于自蒸馏的强化学习
强化学习
检索增强生成
Jonas Hübotter, Frederike Lübeck, Lejs Behric, et al.
聊天机器人作为社交伴侣:人们如何感知机器的意识、类人程度以及社交健康益处
人机交互
心理
Rose E. Guingrich, Michael S. A. Graziano
POPE:通过特权在策略探索学习在难题上进行推理
强化学习
推理
Yuxiao Qu, Amrith Setlur, Virginia Smith, et al.
UniReason 1.0:面向世界知识对齐的图像生成与编辑的统一推理框架
文生图
多模态
Dianyi Wang, Chaofan Ma, Feng Han, et al.
闭环闭环:基于RPG-Encoder的通用仓库表示
代码生成
多模态表征
Jane Luo, Chengyu Yin, Xin Zhang, et al.
视觉-DeepResearch基准:重新思考多模态大语言模型中的视觉与文本搜索
视觉问答
多模态
Yu Zeng, Wenxuan Huang, Zhen Fang, et al.
Vision-DeepResearch:在多模态大语言模型中激励深度研究能力
检索增强生成
视觉问答
Wenxuan Huang, Yu Zeng, Qiuchen Wang, et al.
Kimi K2.5:视觉智能体智能
多模态
多模态表征
Kimi Team, Tongtong Bai, Yifan Bai, et al.
Green-VLA:面向通用机器人的分阶段视觉-语言-动作模型
多模态
统一多模态
I. Apanasevich, M. Artemyev, R. Babakyan, et al.
PaperBanana:为AI科学家自动化学术插图
文生图
AI for Science
Dawei Zhu, Rui Meng, Yale Song, et al.
使用Gemini的半自主数学发现:Erdős问题案例研究
AI for Science
数学
Tony Feng, Trieu Trinh, Garrett Bingham, et al.
潜在思维链作为规划:将推理与语言化分离
LLM
推理
Jiecong Wang, Hao Peng, Chunyang Liu
实时对齐的奖励模型:超越语义
强化学习
LLM
Zixuan Huang, Xin Xia, Yuxi Ren, et al.
DenseGRPO:从稀疏到密集奖励用于流匹配模型对齐
扩散模型
监督式微调
Haoyou Deng, Keyu Yan, Chaojie Mao, et al.
DreamActor-M2:通过时空上下文学习实现通用角色图像动画
视频生成
图生视频
Mingshuang Luo, Shuang Liang, Zhengkun Rong, et al.
TTCS:用于自演化系统的测试时课程合成
LLM
推理
Chengyi Yang, Zhishang Xiang, Yunbo Tang, et al.
ASTRA:智能体轨迹与强化环境的自动化合成
强化学习
LLM
Xiaoyu Tian, Haotian Wang, Shuaiting Chen, et al.
自蒸馏实现持续学习
强化学习
监督式微调
Idan Shenfeld, Mehul Damani, Jonas Hübotter, et al.
面向执行基础的自动化AI研究
LLM
算法
Chenglei Si, Zitong Yang, Yejin Choi, et al.
DynamicVLA:一种用于动态物体操作的视觉-语言-动作模型
机器人技术
具身智能
Haozhe Xie, Beichen Wen, Jiarui Zheng, et al.
MMFineReason:通过开放数据驱动方法弥合多模态推理差距
推理
数据集
Honglin Lin, Zheng Liu, Yun Zhu, et al.
OCRVerse:迈向端到端视觉-语言模型中的全面OCR
OCR
文档理解
Yufeng Zhong, Lei Chen, Xuanle Zhao, et al.
扩展嵌入空间在语言模型中的表现优于扩展专家模型
检索增强生成
Transformer
Hong Liu, Jiaqi Zhang, Chao Wang, et al.
Idea2Story:一种将研究概念自动转化为完整科学叙事的流水线
Agent
LLM
Tengyue Xu, Zhuoyang Qian, Gaoge Liu, et al.
1
2
3
4
48
面向视角自适应的人体视频生成的3D感知隐式运动控制
视频生成
3D 生成
Zhixue Fang, Xu He, Songlin Tang, et al.
daVinci-Agency:高效解锁长周期代理数据
LLM
监督式微调
Mohan Jiang, Dayuan Fu, Junhao Shi, et al.
世界模型的研究并不仅仅是将世界知识注入特定任务中
建模
具身智能
Bohan Zeng, Kaixin Zhu, Daili Hua, et al.
AOrchestra:面向智能体编排的子智能体自动生成
Agent
智能问答
Jianhao Ruan, Zhihao Xu, Yiran Peng, et al.
思维链中缺乏全局规划:揭示LLM的潜在规划时域
LLM
推理
Liyan Xu, Mo Yu, Fandong Meng, et al.
CodeOCR:视觉语言模型在代码理解中的有效性研究
多模态
OCR
Yuling Shi, Chaoxiang Xie, Zhensu Sun, et al.
DeepPlanning:基于可验证约束的长时域Agent规划基准测试
LLM
智能问答
Yinger Zhang, Shutong Jiang, Renhao Li, et al.
CL-bench:上下文学习基准
LLM
智能问答
Shihan Dou, Ming Zhang, Zhangyue Yin, et al.
基于自蒸馏的强化学习
强化学习
检索增强生成
Jonas Hübotter, Frederike Lübeck, Lejs Behric, et al.
聊天机器人作为社交伴侣:人们如何感知机器的意识、类人程度以及社交健康益处
人机交互
心理
Rose E. Guingrich, Michael S. A. Graziano
POPE:通过特权在策略探索学习在难题上进行推理
强化学习
推理
Yuxiao Qu, Amrith Setlur, Virginia Smith, et al.
UniReason 1.0:面向世界知识对齐的图像生成与编辑的统一推理框架
文生图
多模态
Dianyi Wang, Chaofan Ma, Feng Han, et al.
闭环闭环:基于RPG-Encoder的通用仓库表示
代码生成
多模态表征
Jane Luo, Chengyu Yin, Xin Zhang, et al.
视觉-DeepResearch基准:重新思考多模态大语言模型中的视觉与文本搜索
视觉问答
多模态
Yu Zeng, Wenxuan Huang, Zhen Fang, et al.
Vision-DeepResearch:在多模态大语言模型中激励深度研究能力
检索增强生成
视觉问答
Wenxuan Huang, Yu Zeng, Qiuchen Wang, et al.
Kimi K2.5:视觉智能体智能
多模态
多模态表征
Kimi Team, Tongtong Bai, Yifan Bai, et al.
Green-VLA:面向通用机器人的分阶段视觉-语言-动作模型
多模态
统一多模态
I. Apanasevich, M. Artemyev, R. Babakyan, et al.
PaperBanana:为AI科学家自动化学术插图
文生图
AI for Science
Dawei Zhu, Rui Meng, Yale Song, et al.
使用Gemini的半自主数学发现:Erdős问题案例研究
AI for Science
数学
Tony Feng, Trieu Trinh, Garrett Bingham, et al.
潜在思维链作为规划:将推理与语言化分离
LLM
推理
Jiecong Wang, Hao Peng, Chunyang Liu
实时对齐的奖励模型:超越语义
强化学习
LLM
Zixuan Huang, Xin Xia, Yuxi Ren, et al.
DenseGRPO:从稀疏到密集奖励用于流匹配模型对齐
扩散模型
监督式微调
Haoyou Deng, Keyu Yan, Chaojie Mao, et al.
DreamActor-M2:通过时空上下文学习实现通用角色图像动画
视频生成
图生视频
Mingshuang Luo, Shuang Liang, Zhengkun Rong, et al.
TTCS:用于自演化系统的测试时课程合成
LLM
推理
Chengyi Yang, Zhishang Xiang, Yunbo Tang, et al.
ASTRA:智能体轨迹与强化环境的自动化合成
强化学习
LLM
Xiaoyu Tian, Haotian Wang, Shuaiting Chen, et al.
自蒸馏实现持续学习
强化学习
监督式微调
Idan Shenfeld, Mehul Damani, Jonas Hübotter, et al.
面向执行基础的自动化AI研究
LLM
算法
Chenglei Si, Zitong Yang, Yejin Choi, et al.
DynamicVLA:一种用于动态物体操作的视觉-语言-动作模型
机器人技术
具身智能
Haozhe Xie, Beichen Wen, Jiarui Zheng, et al.
MMFineReason:通过开放数据驱动方法弥合多模态推理差距
推理
数据集
Honglin Lin, Zheng Liu, Yun Zhu, et al.
OCRVerse:迈向端到端视觉-语言模型中的全面OCR
OCR
文档理解
Yufeng Zhong, Lei Chen, Xuanle Zhao, et al.
扩展嵌入空间在语言模型中的表现优于扩展专家模型
检索增强生成
Transformer
Hong Liu, Jiaqi Zhang, Chao Wang, et al.
Idea2Story:一种将研究概念自动转化为完整科学叙事的流水线
Agent
LLM
Tengyue Xu, Zhuoyang Qian, Gaoge Liu, et al.
1
2
3
4
48