HyperAI超神经

文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会

关于服务条款隐私政策
中文

HyperAI超神经

Command Palette

Search for a command to run...

首页
论文

论文

每日更新的前沿 AI 研究论文，助您把握人工智能最新动向

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集帮助

产品

资讯教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI超神经

津ICP备17010941号-1

京公网安备11010502038810号

Discord X (formerly Twitter)Bilibili

HyperAI超神经

文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会

关于服务条款隐私政策
中文

HyperAI超神经

Command Palette

Search for a command to run...

首页
论文

论文

每日更新的前沿 AI 研究论文，助您把握人工智能最新动向

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集帮助

产品

资讯教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI超神经

津ICP备17010941号-1

京公网安备11010502038810号

Discord X (formerly Twitter)Bilibili

论文 | HyperAI超神经

无标签的演化语言模型：多数驱动选择，新颖促进变异

无标签的演化语言模型：多数驱动选择，新颖促进变异

Yujun Zhou, Zhenwen Liang, Haolin Liu, et al.

边界推理：通过推理时反思提升规范对齐

边界推理：通过推理时反思提升规范对齐

Haoran Zhang, Yafu Li, Xuyang Hu, et al.

FlowRL：为LLM推理匹配奖励分布

FlowRL：为LLM推理匹配奖励分布

Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, et al.

ScaleCUA：基于跨平台数据的开源计算机使用Agent扩展

ScaleCUA：基于跨平台数据的开源计算机使用Agent扩展

Zhaoyang Liu, JingJing Xie, Zichen Ding, et al.

大型预训练视觉语言模型能否有效担任施工安全检查员？

大型预训练视觉语言模型能否有效担任施工安全检查员？

Xuezheng Chen, Zhengbo Zou

HTSC-2025：面向AI驱动临界温度预测的常压高温超导体基准数据集

HTSC-2025：面向AI驱动临界温度预测的常压高温超导体基准数据集

Xiao-Qi Han, Ze-Feng Gao, Xin-De Wang, et al.

不稳定性奇点的发现

不稳定性奇点的发现

Yongji Wang, Mehdi Bennani, James Martens, et al.

VCBench：在风险投资中对LLMs进行基准测试

VCBench：在风险投资中对LLMs进行基准测试

Rick Chen, Joseph Ternasky, Afriyie Samuel Kwesi, et al.

Wan-Animate：基于整体复制的统一角色动画与替换

Wan-Animate：基于整体复制的统一角色动画与替换

Gang Cheng, Xin Gao, Li Hu, et al.

MedReseacher-R1：基于知识引导轨迹合成框架的专家级医学深度研究者

MedReseacher-R1：基于知识引导轨迹合成框架的专家级医学深度研究者

Ailing Yu, Lan Yao, Jingnan Liu, et al.

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

Zhaoyang Chu, Yao Wan, Zhikun Zhang, et al.

全景图：具身AI时代全向视觉的崛起

全景图：具身AI时代全向视觉的崛起

Xu Zheng, Chenfei Liao, Ziqiao Weng, et al.

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

Hasan Abed Al Kader Hammoud, Mohammad Zbeeb, Bernard Ghanem

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

Daya Guo, Dejian Yang, Haowei Zhang, et al.

教LLM进行规划：用于符号规划的逻辑思维链指令微调

教LLM进行规划：用于符号规划的逻辑思维链指令微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

OpenHA：一系列开源的Minecraft层级化Agent模型

OpenHA：一系列开源的Minecraft层级化Agent模型

Zihao Wang, Muyao Li, Kaichen He, et al.

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

ReSum：通过上下文摘要解锁长时程搜索智能

ReSum：通过上下文摘要解锁长时程搜索智能

Xixi Wu, Kuan Li, Yida Zhao, et al.

WebResearcher：在长时程Agent中释放无边界推理能力

WebResearcher：在长时程Agent中释放无边界推理能力

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

通过环境扩展迈向通用Agent智能

通过环境扩展迈向通用Agent智能

Runnan Fang, Shihao Cai, Baixuan Li, et al.

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

通过持续预训练扩展Agent

通过持续预训练扩展Agent

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

Zijian Li, Xin Guan, Bo Zhang, et al.

大型语言模型中的Glitch Tokens：分类体系与有效检测

大型语言模型中的Glitch Tokens：分类体系与有效检测

Yuxi Li, Yi Liu, Gelei Deng, et al.

REFRAG：重新思考基于RAG的解码

REFRAG：重新思考基于RAG的解码

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

上下文混合用于长视频生成

上下文混合用于长视频生成

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

MusicSwarm：用于音乐创作的生物启发式智能

MusicSwarm：用于音乐创作的生物启发式智能

Markus J. Buehler

LEGO：张量应用的时空加速器生成与优化

LEGO：张量应用的时空加速器生成与优化

Yujun Lin, Zhekai Zhang, Song Han

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

Zixin Yin, Xili Dai, Duomin Wang, et al.

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

Iman Barati, Mostafa Amiri, Heshaam Faili

无标签的演化语言模型：多数驱动选择，新颖促进变异

无标签的演化语言模型：多数驱动选择，新颖促进变异

Yujun Zhou, Zhenwen Liang, Haolin Liu, et al.

边界推理：通过推理时反思提升规范对齐

边界推理：通过推理时反思提升规范对齐

Haoran Zhang, Yafu Li, Xuyang Hu, et al.

FlowRL：为LLM推理匹配奖励分布

FlowRL：为LLM推理匹配奖励分布

Xuekai Zhu, Daixuan Cheng, Dinghuai Zhang, et al.

ScaleCUA：基于跨平台数据的开源计算机使用Agent扩展

ScaleCUA：基于跨平台数据的开源计算机使用Agent扩展

Zhaoyang Liu, JingJing Xie, Zichen Ding, et al.

大型预训练视觉语言模型能否有效担任施工安全检查员？

大型预训练视觉语言模型能否有效担任施工安全检查员？

Xuezheng Chen, Zhengbo Zou

HTSC-2025：面向AI驱动临界温度预测的常压高温超导体基准数据集

HTSC-2025：面向AI驱动临界温度预测的常压高温超导体基准数据集

Xiao-Qi Han, Ze-Feng Gao, Xin-De Wang, et al.

不稳定性奇点的发现

不稳定性奇点的发现

Yongji Wang, Mehdi Bennani, James Martens, et al.

VCBench：在风险投资中对LLMs进行基准测试

VCBench：在风险投资中对LLMs进行基准测试

Rick Chen, Joseph Ternasky, Afriyie Samuel Kwesi, et al.

Wan-Animate：基于整体复制的统一角色动画与替换

Wan-Animate：基于整体复制的统一角色动画与替换

Gang Cheng, Xin Gao, Li Hu, et al.

MedReseacher-R1：基于知识引导轨迹合成框架的专家级医学深度研究者

MedReseacher-R1：基于知识引导轨迹合成框架的专家级医学深度研究者

Ailing Yu, Lan Yao, Jingnan Liu, et al.

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

Zhaoyang Chu, Yao Wan, Zhikun Zhang, et al.

全景图：具身AI时代全向视觉的崛起

全景图：具身AI时代全向视觉的崛起

Xu Zheng, Chenfei Liao, Ziqiao Weng, et al.

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

Hasan Abed Al Kader Hammoud, Mohammad Zbeeb, Bernard Ghanem

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

Daya Guo, Dejian Yang, Haowei Zhang, et al.

教LLM进行规划：用于符号规划的逻辑思维链指令微调

教LLM进行规划：用于符号规划的逻辑思维链指令微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

OpenHA：一系列开源的Minecraft层级化Agent模型

OpenHA：一系列开源的Minecraft层级化Agent模型

Zihao Wang, Muyao Li, Kaichen He, et al.

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

ReSum：通过上下文摘要解锁长时程搜索智能

ReSum：通过上下文摘要解锁长时程搜索智能

Xixi Wu, Kuan Li, Yida Zhao, et al.

WebResearcher：在长时程Agent中释放无边界推理能力

WebResearcher：在长时程Agent中释放无边界推理能力

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

通过环境扩展迈向通用Agent智能

通过环境扩展迈向通用Agent智能

Runnan Fang, Shihao Cai, Baixuan Li, et al.

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

通过持续预训练扩展Agent

通过持续预训练扩展Agent

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

Zijian Li, Xin Guan, Bo Zhang, et al.

大型语言模型中的Glitch Tokens：分类体系与有效检测

大型语言模型中的Glitch Tokens：分类体系与有效检测

Yuxi Li, Yi Liu, Gelei Deng, et al.

REFRAG：重新思考基于RAG的解码

REFRAG：重新思考基于RAG的解码

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

上下文混合用于长视频生成

上下文混合用于长视频生成

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

MusicSwarm：用于音乐创作的生物启发式智能

MusicSwarm：用于音乐创作的生物启发式智能

Markus J. Buehler

LEGO：张量应用的时空加速器生成与优化

LEGO：张量应用的时空加速器生成与优化

Yujun Lin, Zhekai Zhang, Song Han

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

Zixin Yin, Xili Dai, Duomin Wang, et al.

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

Iman Barati, Mostafa Amiri, Heshaam Faili