HyperAI超神经

文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会

关于服务条款隐私政策
中文

HyperAI超神经

Command Palette

Search for a command to run...

首页
论文

论文

每日更新的前沿 AI 研究论文，助您把握人工智能最新动向

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集帮助

产品

资讯教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI超神经

津ICP备17010941号-1

京公网安备11010502038810号

Discord X (formerly Twitter)Bilibili

HyperAI超神经

文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会

关于服务条款隐私政策
中文

HyperAI超神经

Command Palette

Search for a command to run...

首页
论文

论文

每日更新的前沿 AI 研究论文，助您把握人工智能最新动向

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们数据集帮助

产品

资讯教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI超神经

津ICP备17010941号-1

京公网安备11010502038810号

Discord X (formerly Twitter)Bilibili

论文 | HyperAI超神经

迈向大语言模型后训练的统一视角

迈向大语言模型后训练的统一视角

Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.

从编辑到密集几何估计器

从编辑到密集几何估计器

JiYuan Wang, Chunyu Lin, Lei Sun, et al.

Drivel-ology：通过深度解读荒谬内容挑战LLM

Drivel-ology：通过深度解读荒谬内容挑战LLM

Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.

龙：通过验证器实现大规模长链思维合成

龙：通过验证器实现大规模长链思维合成

Xingyue Huang, Rishabh, Gregor Franke, et al.

ArcMemo：基于持续学习LLM记忆的抽象推理组合

ArcMemo：基于持续学习LLM记忆的抽象推理组合

Matthew Ho, Chen Si, Zhaoxiang Feng, et al.

CoT-Space：通过强化学习实现内部慢思考的理论框架

CoT-Space：通过强化学习实现内部慢思考的理论框架

Zeyu Gan, Hao Yi, Yong Liu

多视角三维点跟踪

多视角三维点跟踪

Frano Rajič, Haofei Xu, Marko Mihajlovic, et al.

2022年Landslide4Sense竞赛结果：基于多源卫星影像的先进滑坡检测

2022年Landslide4Sense竞赛结果：基于多源卫星影像的先进滑坡检测

Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.

MOSAIC：通过对应感知对齐与解耦实现多主体个性化生成

MOSAIC：通过对应感知对齐与解耦实现多主体个性化生成

Dong She, Siming Fu, Mushui Liu, et al.

基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成

基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成

Xuechao Zou, Shun Zhang, Xing Fu, et al.

基于嵌入的检索的理论局限性

基于嵌入的检索的理论局限性

Orion Weller, Michael Boratko, Iftekhar Naim, et al.

LMEnt：一种从预训练数据到表征分析语言模型知识的工具套件

LMEnt：一种从预训练数据到表征分析语言模型知识的工具套件

Daniela Gottesman, Alon Gilae-Dotan, Ido Cohen, et al.

开放数据合成用于深度研究

开放数据合成用于深度研究

Ziyi Xia, Kun Luo, Hongjin Qian, et al.

Robix：一种用于机器人交互、推理与规划的统一模型

Robix：一种用于机器人交互、推理与规划的统一模型

Huang Fang, Mengxi Zhang, Heng Dong, et al.

对语言模型进行红队测试以减少危害：方法、扩展行为与经验教训

对语言模型进行红队测试以减少危害：方法、扩展行为与经验教训

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

FusionProt：融合序列与结构信息的统一蛋白质表示学习

FusionProt：融合序列与结构信息的统一蛋白质表示学习

Dan Kalifa, Uriel Singer, Kira Radinsky

LimiX：释放通用智能的结构化数据建模能力

LimiX：释放通用智能的结构化数据建模能力

Xingxuan Zhang, Gang Ren, Han Yu, et al.

epiGPTope：一种基于机器学习的表位生成与分类工具

epiGPTope：一种基于机器学习的表位生成与分类工具

Natalia Flechas Manrique, Alberto Martínez, Elena López-Martínez, et al.

GenCompositor：基于扩散Transformer的生成式视频合成

GenCompositor：基于扩散Transformer的生成式视频合成

Shuzhou Yang, Xiaoyu Li, Xiaodong Cun, et al.

DCPO：动态裁剪策略优化

DCPO：动态裁剪策略优化

Shihui Yang, Chengfeng Dou, Peidong Guo, et al.

推理向量：通过任务算术转移思维链能力

推理向量：通过任务算术转移思维链能力

Mohammad Zbeeb, Hasan Abed Al Kader Hammoud, Bernard Ghanem

Baichuan-M2：基于大型验证系统扩展医学能力

Baichuan-M2：基于大型验证系统扩展医学能力

Baichuan-M2 Team, Chengfeng Dou, Chong Liu, et al.

VerlTool：面向具工具使用的整体性智能体强化学习

VerlTool：面向具工具使用的整体性智能体强化学习

Dongfu Jiang, Yi Lu, Zhuofeng Li, et al.

ELV-Halluc：长视频理解中语义聚合幻觉的基准测试

ELV-Halluc：长视频理解中语义聚合幻觉的基准测试

Hao Lu, Jiahao Wang, Yaolun Zhang, et al.

MedChatZH：一个更优的医疗顾问通过更优的指令学习

MedChatZH：一个更优的医疗顾问通过更优的指令学习

Yang Tan, Mingchen Li, Zijie Huang, et al.

AlphaEarth Foundations：一种基于嵌入场的模型，用于从稀疏标签数据中实现精确且高效的全球制图

AlphaEarth Foundations：一种基于嵌入场的模型，用于从稀疏标签数据中实现精确且高效的全球制图

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

AetherCode：评估LLMs在顶级编程竞赛中获胜的能力

AetherCode：评估LLMs在顶级编程竞赛中获胜的能力

Zihan Wang, Jiaze Chen, Zhicheng Liu, et al.

TileLang：一种面向AI系统的可组合分块编程模型

TileLang：一种面向AI系统的可组合分块编程模型

Wang Lei, Cheng Yu, Shi Yining, et al.

Kimi-VL 技术报告

Kimi-VL 技术报告

Kimi Team, Angang Du, Bohong Yin, et al.

DeepSeek-R1 思维学：让我们探讨 LLM 推理

DeepSeek-R1 思维学：让我们探讨 LLM 推理

Sara Vera Marjanović, Arkil Patel, Vaibhav Adlakha, et al.

基于双轴传播的多本体集成用于医学概念表示

基于双轴传播的多本体集成用于医学概念表示

Mohsen Nayebi Kerdabadi, Arya Hadizadeh Moghaddam, Dongjie Wang, Zijun Yao

使用协作式多Agent LLM架构从SOAP病历中自动检测临床问题

使用协作式多Agent LLM架构从SOAP病历中自动检测临床问题

Yeawon Lee, Xiaoyang Wang, Christopher C. Yang

迈向大语言模型后训练的统一视角

迈向大语言模型后训练的统一视角

Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.

从编辑到密集几何估计器

从编辑到密集几何估计器

JiYuan Wang, Chunyu Lin, Lei Sun, et al.

Drivel-ology：通过深度解读荒谬内容挑战LLM

Drivel-ology：通过深度解读荒谬内容挑战LLM

Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.

龙：通过验证器实现大规模长链思维合成

龙：通过验证器实现大规模长链思维合成

Xingyue Huang, Rishabh, Gregor Franke, et al.

ArcMemo：基于持续学习LLM记忆的抽象推理组合

ArcMemo：基于持续学习LLM记忆的抽象推理组合

Matthew Ho, Chen Si, Zhaoxiang Feng, et al.

CoT-Space：通过强化学习实现内部慢思考的理论框架

CoT-Space：通过强化学习实现内部慢思考的理论框架

Zeyu Gan, Hao Yi, Yong Liu

多视角三维点跟踪

多视角三维点跟踪

Frano Rajič, Haofei Xu, Marko Mihajlovic, et al.

2022年Landslide4Sense竞赛结果：基于多源卫星影像的先进滑坡检测

2022年Landslide4Sense竞赛结果：基于多源卫星影像的先进滑坡检测

Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.

MOSAIC：通过对应感知对齐与解耦实现多主体个性化生成

MOSAIC：通过对应感知对齐与解耦实现多主体个性化生成

Dong She, Siming Fu, Mushui Liu, et al.

基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成

基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成

Xuechao Zou, Shun Zhang, Xing Fu, et al.

基于嵌入的检索的理论局限性

基于嵌入的检索的理论局限性

Orion Weller, Michael Boratko, Iftekhar Naim, et al.

LMEnt：一种从预训练数据到表征分析语言模型知识的工具套件

LMEnt：一种从预训练数据到表征分析语言模型知识的工具套件

Daniela Gottesman, Alon Gilae-Dotan, Ido Cohen, et al.

开放数据合成用于深度研究

开放数据合成用于深度研究

Ziyi Xia, Kun Luo, Hongjin Qian, et al.

Robix：一种用于机器人交互、推理与规划的统一模型

Robix：一种用于机器人交互、推理与规划的统一模型

Huang Fang, Mengxi Zhang, Heng Dong, et al.

对语言模型进行红队测试以减少危害：方法、扩展行为与经验教训

对语言模型进行红队测试以减少危害：方法、扩展行为与经验教训

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

FusionProt：融合序列与结构信息的统一蛋白质表示学习

FusionProt：融合序列与结构信息的统一蛋白质表示学习

Dan Kalifa, Uriel Singer, Kira Radinsky

LimiX：释放通用智能的结构化数据建模能力

LimiX：释放通用智能的结构化数据建模能力

Xingxuan Zhang, Gang Ren, Han Yu, et al.

epiGPTope：一种基于机器学习的表位生成与分类工具

epiGPTope：一种基于机器学习的表位生成与分类工具

Natalia Flechas Manrique, Alberto Martínez, Elena López-Martínez, et al.

GenCompositor：基于扩散Transformer的生成式视频合成

GenCompositor：基于扩散Transformer的生成式视频合成

Shuzhou Yang, Xiaoyu Li, Xiaodong Cun, et al.

DCPO：动态裁剪策略优化

DCPO：动态裁剪策略优化

Shihui Yang, Chengfeng Dou, Peidong Guo, et al.

推理向量：通过任务算术转移思维链能力

推理向量：通过任务算术转移思维链能力

Mohammad Zbeeb, Hasan Abed Al Kader Hammoud, Bernard Ghanem

Baichuan-M2：基于大型验证系统扩展医学能力

Baichuan-M2：基于大型验证系统扩展医学能力

Baichuan-M2 Team, Chengfeng Dou, Chong Liu, et al.

VerlTool：面向具工具使用的整体性智能体强化学习

VerlTool：面向具工具使用的整体性智能体强化学习

Dongfu Jiang, Yi Lu, Zhuofeng Li, et al.

ELV-Halluc：长视频理解中语义聚合幻觉的基准测试

ELV-Halluc：长视频理解中语义聚合幻觉的基准测试

Hao Lu, Jiahao Wang, Yaolun Zhang, et al.

MedChatZH：一个更优的医疗顾问通过更优的指令学习

MedChatZH：一个更优的医疗顾问通过更优的指令学习

Yang Tan, Mingchen Li, Zijie Huang, et al.

AlphaEarth Foundations：一种基于嵌入场的模型，用于从稀疏标签数据中实现精确且高效的全球制图

AlphaEarth Foundations：一种基于嵌入场的模型，用于从稀疏标签数据中实现精确且高效的全球制图

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

AetherCode：评估LLMs在顶级编程竞赛中获胜的能力

AetherCode：评估LLMs在顶级编程竞赛中获胜的能力

Zihan Wang, Jiaze Chen, Zhicheng Liu, et al.

TileLang：一种面向AI系统的可组合分块编程模型

TileLang：一种面向AI系统的可组合分块编程模型

Wang Lei, Cheng Yu, Shi Yining, et al.

Kimi-VL 技术报告

Kimi-VL 技术报告

Kimi Team, Angang Du, Bohong Yin, et al.

DeepSeek-R1 思维学：让我们探讨 LLM 推理

DeepSeek-R1 思维学：让我们探讨 LLM 推理

Sara Vera Marjanović, Arkil Patel, Vaibhav Adlakha, et al.

基于双轴传播的多本体集成用于医学概念表示

基于双轴传播的多本体集成用于医学概念表示

Mohsen Nayebi Kerdabadi, Arya Hadizadeh Moghaddam, Dongjie Wang, Zijun Yao

使用协作式多Agent LLM架构从SOAP病历中自动检测临床问题

使用协作式多Agent LLM架构从SOAP病历中自动检测临床问题

Yeawon Lee, Xiaoyang Wang, Christopher C. Yang