HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
F5-TTS:一种通过流匹配实现流畅且忠实语音伪造的童话讲述者
Yushen Chen, Zhikang Niu, Ziyang Ma, et al.
VOccl3D:一种用于真实遮挡下3D人体姿态与形状估计的视频基准数据集
Yash Garg, Saketh Bachu, Arindam Dutta, et al.
F5-TTS:一种通过流匹配实现流畅且忠实语音伪造的童话讲述者
Yushen Chen, Zhikang Niu, Ziyang Ma, et al.
VOccl3D:一种用于真实遮挡下3D人体姿态与形状估计的视频基准数据集
Yash Garg, Saketh Bachu, Arindam Dutta, et al.
Alpamayo-R1:面向长尾场景下可泛化的自动驾驶,连接推理与行为预测
NVIDIA
环环相扣:一场关于测试时记忆、注意力偏差、保留与在线优化的探索之旅
Ali Behrouz, Meisam Razaviyayn, Peilin Zhong, et al.
Alpamayo-R1:面向长尾场景下可泛化的自动驾驶,连接推理与行为预测
NVIDIA
环环相扣:一场关于测试时记忆、注意力偏差、保留与在线优化的探索之旅
Ali Behrouz, Meisam Razaviyayn, Peilin Zhong, et al.
重新思考文本到视觉生成中推理时扩展的提示设计
Subin Kim, Sangwoo Mo, Mamshad Nayeem Rizve, et al.
作为反探索的视觉-语言-动作模型引导:一种测试时扩展方法
Siyuan Yang, Yang Zhang, Haoran He, et al.
OneThinker:面向图像与视频的全功能推理模型
Kaituo Feng, Manyuan Zhang, Hongyu Li, et al.
重新思考文本到视觉生成中推理时扩展的提示设计
Subin Kim, Sangwoo Mo, Mamshad Nayeem Rizve, et al.
作为反探索的视觉-语言-动作模型引导:一种测试时扩展方法
Siyuan Yang, Yang Zhang, Haoran He, et al.
OneThinker:面向图像与视频的全功能推理模型
Kaituo Feng, Manyuan Zhang, Hongyu Li, et al.
ViDiC:视频差异描述
Jiangtao Wu, Shihao Li, Zhaozhou Bian, et al.
PretrainZero:强化主动预训练
Xingrun Xing, Zhiyuan Fan, Jie Lou, et al.
每个Token都至关重要:在大型语言模型中泛化16M超长上下文
Xiang Hu, Zhanchao Zhou, Ruiqi Liang, et al.
ViDiC:视频差异描述
Jiangtao Wu, Shihao Li, Zhaozhou Bian, et al.
PretrainZero:强化主动预训练
Xingrun Xing, Zhiyuan Fan, Jie Lou, et al.
每个Token都至关重要:在大型语言模型中泛化16M超长上下文
Xiang Hu, Zhanchao Zhou, Ruiqi Liang, et al.
SimScale:通过大规模真实世界仿真学习驾驶
Haochen Tian, Tianyu Li, Haochen Liu, et al.
Skywork-R1V4:通过图像与DeepResearch的交织思维迈向智能多模态代理
Yifan Zhang, Liang Hu, Haofeng Sun, et al.
SimScale:通过大规模真实世界仿真学习驾驶
Haochen Tian, Tianyu Li, Haochen Liu, et al.
Skywork-R1V4:通过图像与DeepResearch的交织思维迈向智能多模态代理
Yifan Zhang, Liang Hu, Haofeng Sun, et al.
基于最小人类监督的引导式自进化LLM
Wenhao Yu, Zhenwen Liang, Chengsong Huang, et al.
MultiShotMaster:一种可控制的多镜头视频生成框架
Qinghe Wang, Xiaoyu Shi, Baolu Li, et al.
MG-Nav:通过稀疏空间记忆实现的双尺度视觉导航
Bo Wang, Jiehong Lin, Chenzhi Liu, et al.
基于最小人类监督的引导式自进化LLM
Wenhao Yu, Zhenwen Liang, Chengsong Huang, et al.
MultiShotMaster:一种可控制的多镜头视频生成框架
Qinghe Wang, Xiaoyu Shi, Baolu Li, et al.
MG-Nav:通过稀疏空间记忆实现的双尺度视觉导航
Bo Wang, Jiehong Lin, Chenzhi Liu, et al.
一致性评论者:通过参考引导的注意力对齐修正生成图像中的不一致性
Ziheng Ouyang, Yiren Song, Yaoli Liu, et al.
我们距离真正有用的深度研究Agent还有多远?
Dingling Zhang, He Zhu, Jincheng Ren, et al.
一致性评论者:通过参考引导的注意力对齐修正生成图像中的不一致性
Ziheng Ouyang, Yiren Song, Yaoli Liu, et al.
我们距离真正有用的深度研究Agent还有多远?
Dingling Zhang, He Zhu, Jincheng Ren, et al.
基于LLM的强化学习稳定性优化:方法与实践
Chujie Zheng, Kai Dang, Bowen Yu, et al.
Envision:面向因果世界过程洞察的统一理解与生成基准测试
Juanxi Tian, Siyuan Li, Conghui He, et al.
LongVT:通过原生工具调用激励“以长视频进行思考”
Zuhao Yang, Sudong Wang, Kaichen Zhang, et al.
基于LLM的强化学习稳定性优化:方法与实践
Chujie Zheng, Kai Dang, Bowen Yu, et al.
Envision:面向因果世界过程洞察的统一理解与生成基准测试
Juanxi Tian, Siyuan Li, Conghui He, et al.
LongVT:通过原生工具调用激励“以长视频进行思考”
Zuhao Yang, Sudong Wang, Kaichen Zhang, et al.
从代码基础模型到Agent与应用:代码智能实用指南
Jian Yang, Wei Zhang, Shark Liu, et al.
基于物理驱动的时空建模用于AI生成视频检测
Shuhai Zhang, ZiHao Lian, Jiahao Yang, et al.
从代码基础模型到Agent与应用:代码智能实用指南
Jian Yang, Wei Zhang, Shark Liu, et al.
基于物理驱动的时空建模用于AI生成视频检测
Shuhai Zhang, ZiHao Lian, Jiahao Yang, et al.
Mem-α:通过强化学习学习记忆构建
Yu Wang, Ryuichi Takanobu, Zhiqi Liang, et al.
搜索自对弈:在无监督条件下推进Agent能力的边界
Hongliang Lu, Yuhang Wen, Pengyu Cheng, et al.
CudaForge:一种支持硬件反馈的CUDA内核优化Agent框架
Zijian Zhang, Rong Wang, Shiyang Li, et al.
Mem-α:通过强化学习学习记忆构建
Yu Wang, Ryuichi Takanobu, Zhiqi Liang, et al.
搜索自对弈:在无监督条件下推进Agent能力的边界
Hongliang Lu, Yuhang Wen, Pengyu Cheng, et al.
CudaForge:一种支持硬件反馈的CUDA内核优化Agent框架
Zijian Zhang, Rong Wang, Shiyang Li, et al.
ScaleNet:通过增量参数扩展预训练神经网络
Zhiwei Hao, Jianyuan Guo, Li Shen, et al.
优化块注意力混合
Guangxuan Xiao, Junxian Guo, Kasra Mazaheri, et al.
ScaleNet:通过增量参数扩展预训练神经网络
Zhiwei Hao, Jianyuan Guo, Li Shen, et al.
优化块注意力混合
Guangxuan Xiao, Junxian Guo, Kasra Mazaheri, et al.
分形取证:通过分形水印实现主动式深度伪造检测与定位
Tianyi Wang, Harry Cheng, Ming-Hui Liu, et al.
思维链劫持
Jianli Zhao, Tingchen Fu, Rylan Schaeffer, et al.
InstanceAssemble:通过实例组装注意力实现布局感知的图像生成
Qiang Xiang, Shuang Sun, Binglei Li, et al.
分形取证:通过分形水印实现主动式深度伪造检测与定位
Tianyi Wang, Harry Cheng, Ming-Hui Liu, et al.
思维链劫持
Jianli Zhao, Tingchen Fu, Rylan Schaeffer, et al.
InstanceAssemble:通过实例组装注意力实现布局感知的图像生成
Qiang Xiang, Shuang Sun, Binglei Li, et al.
3EED:在三维空间中处处实现万物具身化
Rong Li, Yuhao Dong, Tianshuai Hu, et al.
DetectiumFire:一个全面的多模态数据集,连接视觉与语言以实现火灾理解
Zixuan Liu, Siavash H. Khajavi, Guangkai Jiang
1
2
3
4
37
3EED:在三维空间中处处实现万物具身化
Rong Li, Yuhao Dong, Tianshuai Hu, et al.
DetectiumFire:一个全面的多模态数据集,连接视觉与语言以实现火灾理解
Zixuan Liu, Siavash H. Khajavi, Guangkai Jiang
1
2
3
4
37
论文 | HyperAI超神经