HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
短窗口注意力实现长期记忆化
Transformer
模型训练
Loïc Cabannes, Maximilian Beck, Gergely Szilvasy, et al.
World Craft:通过文本创建可可视化世界的智能体框架
Agent
3D 生成
Jianwen Sun, Yukang Feng, Kaining Ying, et al.
视觉生成通过多模态世界模型解锁类人推理
多模态
推理
Jialong Wu, Xiaoying Zhang, Hongyi Yuan, et al.
掩码深度建模用于空间感知
深度估计
感知
Bin Tan, Changjiang Sun, Xiage Qin, et al.
一种实用的VLA基础模型
机器人技术
具身智能
Wei Wu, Fan Lu, Yunnan Wang, et al.
AdaReasoner:用于迭代视觉推理的动态工具编排
推理
LLM
Mingyang Song, Haoyu Sun, Jiawei Gu, et al.
AgentDoG:面向AI Agent安全与可信的诊断防护框架
Agent
基准
Dongrui Liu, Qihan Ren, Chen Qian, et al.
Arcee Trinity 大型技术报告
LLM
模型训练
Varun Singh, Lucas Krauss, Sami Jaghouar, et al.
让模型学会自我教学:在可学习性边缘的推理
强化学习
推理
Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.
ATLAS:多语言预训练、微调与解码多语言困境的自适应迁移缩放定律
LLM
语言
Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.
iFSQ:仅需一行代码提升图像生成中的FSQ性能
图像生成
扩散模型
Bin Lin, Zongjian Li, Yuwei Niu, et al.
弹性注意力:面向高效Transformer的测试时自适应稀疏率
Transformer
LLM
Zecheng Tang, Quantong Qiu, Yi Yang, et al.
科学图像生成:基准测试、方法论及下游应用价值
文生图
扩散模型
Honglin Lin, Chonghan Qin, Zheng Liu, et al.
脚本即一切:一种面向长时程对话到影视视频生成的智能体框架
文生视频
视频生成
Chenyu Mu, Xin He, Qu Yang, et al.
daVinci-Dev:面向软件工程的Agent原生中段训练
Agent
LLM
Ji Zeng, Dayuan Fu, Tiantian Mi, et al.
LLM能否帮你收拾烂摊子?基于LLM的应用就绪数据准备综述
LLM
自然语言处理
Wei Zhou, Jun Zhou, Haoyu Wang, et al.
DeepSeek-OCR 2:视觉因果流
DeepSeek
文档理解
Haoran Wei, Yaofeng Sun, Yukun Li
学习测试时发现
强化学习
LLM
Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.
通过在防护输出上微调以诱发有害能力
监督式微调
开源
Jackson Kaunismaa, Avery Griffin, John Hughes, et al.
Memory-V2V:通过记忆增强视频到视频扩散模型
扩散模型
视频处理
Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.
推理时扩展验证:通过测试时评分标准引导的验证实现自演化深度研究Agent
Agent
LLM
Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.
VisGym:面向多模态Agent的多样化、可定制化、可扩展环境
Agent
具身智能
Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.
TwinBrainVLA:通过非对称Transformer混合模型释放通用VLM在具身任务中的潜力
机器人技术
具身智能
Bin Yu, Shijie Lian, Xiaopeng Lin, et al.
SWE-Pruner:面向编码Agent的自适应上下文剪枝
Agent
代码生成
Yuhang Wang, Yuling Shi, Mo Yang, et al.
LongCat-Flash-Thinking-2601 技术报告
Agent
推理
Meituan LongCat Team, Anchun Gui, Bei Li, et al.
语言模型能否发现缩放定律?
Agent
LLM
Haowei Lin, Haotian Ye, Wenzheng Feng, et al.
Cosmos Policy:针对视觉运动控制与规划微调视频模型
视频生成
机器人技术
Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.
基于表征自编码器的文本到图像扩散Transformer的扩展
文生图
扩散模型
Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.
BayesianVLA:通过潜在动作查询对视觉-语言-动作模型进行贝叶斯分解
机器人技术
多模态表征
Shijie Lian, Bin Yu, Xiaopeng Lin, et al.
灵活性陷阱:为何任意顺序限制制约了扩散语言模型的推理潜力
扩散模型
推理
Zanlin Ni, Shenzhi Wang, Yang Yue, et al.
沙箱中的LLM激发通用代理智能
Agent
LLM
Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.
HERMES:将KV缓存作为分层内存以实现高效的流式视频理解
视频理解
视频处理
Haowei Zhang, Shudong Yang, Jinlan Fu, et al.
1
2
3
4
5
48
短窗口注意力实现长期记忆化
Transformer
模型训练
Loïc Cabannes, Maximilian Beck, Gergely Szilvasy, et al.
World Craft:通过文本创建可可视化世界的智能体框架
Agent
3D 生成
Jianwen Sun, Yukang Feng, Kaining Ying, et al.
视觉生成通过多模态世界模型解锁类人推理
多模态
推理
Jialong Wu, Xiaoying Zhang, Hongyi Yuan, et al.
掩码深度建模用于空间感知
深度估计
感知
Bin Tan, Changjiang Sun, Xiage Qin, et al.
一种实用的VLA基础模型
机器人技术
具身智能
Wei Wu, Fan Lu, Yunnan Wang, et al.
AdaReasoner:用于迭代视觉推理的动态工具编排
推理
LLM
Mingyang Song, Haoyu Sun, Jiawei Gu, et al.
AgentDoG:面向AI Agent安全与可信的诊断防护框架
Agent
基准
Dongrui Liu, Qihan Ren, Chen Qian, et al.
Arcee Trinity 大型技术报告
LLM
模型训练
Varun Singh, Lucas Krauss, Sami Jaghouar, et al.
让模型学会自我教学:在可学习性边缘的推理
强化学习
推理
Shobhita Sundaram, John Quan, Ariel Kwiatkowski, et al.
ATLAS:多语言预训练、微调与解码多语言困境的自适应迁移缩放定律
LLM
语言
Shayne Longpre, Sneha Kudugunta, Niklas Muennighoff, et al.
iFSQ:仅需一行代码提升图像生成中的FSQ性能
图像生成
扩散模型
Bin Lin, Zongjian Li, Yuwei Niu, et al.
弹性注意力:面向高效Transformer的测试时自适应稀疏率
Transformer
LLM
Zecheng Tang, Quantong Qiu, Yi Yang, et al.
科学图像生成:基准测试、方法论及下游应用价值
文生图
扩散模型
Honglin Lin, Chonghan Qin, Zheng Liu, et al.
脚本即一切:一种面向长时程对话到影视视频生成的智能体框架
文生视频
视频生成
Chenyu Mu, Xin He, Qu Yang, et al.
daVinci-Dev:面向软件工程的Agent原生中段训练
Agent
LLM
Ji Zeng, Dayuan Fu, Tiantian Mi, et al.
LLM能否帮你收拾烂摊子?基于LLM的应用就绪数据准备综述
LLM
自然语言处理
Wei Zhou, Jun Zhou, Haoyu Wang, et al.
DeepSeek-OCR 2:视觉因果流
DeepSeek
文档理解
Haoran Wei, Yaofeng Sun, Yukun Li
学习测试时发现
强化学习
LLM
Mert Yuksekgonul, Daniel Koceja, Xinhao Li, et al.
通过在防护输出上微调以诱发有害能力
监督式微调
开源
Jackson Kaunismaa, Avery Griffin, John Hughes, et al.
Memory-V2V:通过记忆增强视频到视频扩散模型
扩散模型
视频处理
Dohun Lee, Chun-Hao Paul Huang, Xuelin Chen, et al.
推理时扩展验证:通过测试时评分标准引导的验证实现自演化深度研究Agent
Agent
LLM
Yuxuan Wan, Tianqing Fang, Zaitang Li, et al.
VisGym:面向多模态Agent的多样化、可定制化、可扩展环境
Agent
具身智能
Zirui Wang, Junyi Zhang, Jiaxin Ge, et al.
TwinBrainVLA:通过非对称Transformer混合模型释放通用VLM在具身任务中的潜力
机器人技术
具身智能
Bin Yu, Shijie Lian, Xiaopeng Lin, et al.
SWE-Pruner:面向编码Agent的自适应上下文剪枝
Agent
代码生成
Yuhang Wang, Yuling Shi, Mo Yang, et al.
LongCat-Flash-Thinking-2601 技术报告
Agent
推理
Meituan LongCat Team, Anchun Gui, Bei Li, et al.
语言模型能否发现缩放定律?
Agent
LLM
Haowei Lin, Haotian Ye, Wenzheng Feng, et al.
Cosmos Policy:针对视觉运动控制与规划微调视频模型
视频生成
机器人技术
Moo Jin Kim, Yihuai Gao, Tsung-Yi Lin, et al.
基于表征自编码器的文本到图像扩散Transformer的扩展
文生图
扩散模型
Shengbang Tong, Boyang Zheng, Ziteng Wang, et al.
BayesianVLA:通过潜在动作查询对视觉-语言-动作模型进行贝叶斯分解
机器人技术
多模态表征
Shijie Lian, Bin Yu, Xiaopeng Lin, et al.
灵活性陷阱:为何任意顺序限制制约了扩散语言模型的推理潜力
扩散模型
推理
Zanlin Ni, Shenzhi Wang, Yang Yue, et al.
沙箱中的LLM激发通用代理智能
Agent
LLM
Daixuan Cheng, Shaohan Huang, Yuxian Gu, et al.
HERMES:将KV缓存作为分层内存以实现高效的流式视频理解
视频理解
视频处理
Haowei Zhang, Shudong Yang, Jinlan Fu, et al.
1
2
3
4
5
48