HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
论文
论文
每日更新的前沿 AI 研究论文,助您把握人工智能最新动向
论文 | HyperAI超神经
迈向大语言模型后训练的统一视角
Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.
从编辑到密集几何估计器
JiYuan Wang, Chunyu Lin, Lei Sun, et al.
Drivel-ology:通过深度解读荒谬内容挑战LLM
Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.
龙:通过验证器实现大规模长链思维合成
Xingyue Huang, Rishabh, Gregor Franke, et al.
ArcMemo:基于持续学习LLM记忆的抽象推理组合
Matthew Ho, Chen Si, Zhaoxiang Feng, et al.
CoT-Space:通过强化学习实现内部慢思考的理论框架
Zeyu Gan, Hao Yi, Yong Liu
多视角三维点跟踪
Frano Rajič, Haofei Xu, Marko Mihajlovic, et al.
2022年Landslide4Sense竞赛结果:基于多源卫星影像的先进滑坡检测
Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.
MOSAIC:通过对应感知对齐与解耦实现多主体个性化生成
Dong She, Siming Fu, Mushui Liu, et al.
基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成
Xuechao Zou, Shun Zhang, Xing Fu, et al.
基于嵌入的检索的理论局限性
Orion Weller, Michael Boratko, Iftekhar Naim, et al.
LMEnt:一种从预训练数据到表征分析语言模型知识的工具套件
Daniela Gottesman, Alon Gilae-Dotan, Ido Cohen, et al.
开放数据合成用于深度研究
Ziyi Xia, Kun Luo, Hongjin Qian, et al.
Robix:一种用于机器人交互、推理与规划的统一模型
Huang Fang, Mengxi Zhang, Heng Dong, et al.
对语言模型进行红队测试以减少危害:方法、扩展行为与经验教训
Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.
FusionProt:融合序列与结构信息的统一蛋白质表示学习
Dan Kalifa, Uriel Singer, Kira Radinsky
LimiX:释放通用智能的结构化数据建模能力
Xingxuan Zhang, Gang Ren, Han Yu, et al.
epiGPTope:一种基于机器学习的表位生成与分类工具
Natalia Flechas Manrique, Alberto Martínez, Elena López-Martínez, et al.
GenCompositor:基于扩散Transformer的生成式视频合成
Shuzhou Yang, Xiaoyu Li, Xiaodong Cun, et al.
DCPO:动态裁剪策略优化
Shihui Yang, Chengfeng Dou, Peidong Guo, et al.
推理向量:通过任务算术转移思维链能力
Mohammad Zbeeb, Hasan Abed Al Kader Hammoud, Bernard Ghanem
Baichuan-M2:基于大型验证系统扩展医学能力
Baichuan-M2 Team, Chengfeng Dou, Chong Liu, et al.
VerlTool:面向具工具使用的整体性智能体强化学习
Dongfu Jiang, Yi Lu, Zhuofeng Li, et al.
ELV-Halluc:长视频理解中语义聚合幻觉的基准测试
Hao Lu, Jiahao Wang, Yaolun Zhang, et al.
MedChatZH:一个更优的医疗顾问通过更优的指令学习
Yang Tan, Mingchen Li, Zijie Huang, et al.
AlphaEarth Foundations:一种基于嵌入场的模型,用于从稀疏标签数据中实现精确且高效的全球制图
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
AetherCode:评估LLMs在顶级编程竞赛中获胜的能力
Zihan Wang, Jiaze Chen, Zhicheng Liu, et al.
TileLang:一种面向AI系统的可组合分块编程模型
Wang Lei, Cheng Yu, Shi Yining, et al.
Kimi-VL 技术报告
Kimi Team, Angang Du, Bohong Yin, et al.
DeepSeek-R1 思维学:让我们探讨 LLM 推理
Sara Vera Marjanović, Arkil Patel, Vaibhav Adlakha, et al.
基于双轴传播的多本体集成用于医学概念表示
Mohsen Nayebi Kerdabadi, Arya Hadizadeh Moghaddam, Dongjie Wang, Zijun Yao
使用协作式多Agent LLM架构从SOAP病历中自动检测临床问题
Yeawon Lee, Xiaoyang Wang, Christopher C. Yang
1
17
18
19
20
21
22
23
37
迈向大语言模型后训练的统一视角
Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.
从编辑到密集几何估计器
JiYuan Wang, Chunyu Lin, Lei Sun, et al.
Drivel-ology:通过深度解读荒谬内容挑战LLM
Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.
龙:通过验证器实现大规模长链思维合成
Xingyue Huang, Rishabh, Gregor Franke, et al.
ArcMemo:基于持续学习LLM记忆的抽象推理组合
Matthew Ho, Chen Si, Zhaoxiang Feng, et al.
CoT-Space:通过强化学习实现内部慢思考的理论框架
Zeyu Gan, Hao Yi, Yong Liu
多视角三维点跟踪
Frano Rajič, Haofei Xu, Marko Mihajlovic, et al.
2022年Landslide4Sense竞赛结果:基于多源卫星影像的先进滑坡检测
Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.
MOSAIC:通过对应感知对齐与解耦实现多主体个性化生成
Dong She, Siming Fu, Mushui Liu, et al.
基于扩散Transformer的全局与局部专家混合模型实现可控人脸生成
Xuechao Zou, Shun Zhang, Xing Fu, et al.
基于嵌入的检索的理论局限性
Orion Weller, Michael Boratko, Iftekhar Naim, et al.
LMEnt:一种从预训练数据到表征分析语言模型知识的工具套件
Daniela Gottesman, Alon Gilae-Dotan, Ido Cohen, et al.
开放数据合成用于深度研究
Ziyi Xia, Kun Luo, Hongjin Qian, et al.
Robix:一种用于机器人交互、推理与规划的统一模型
Huang Fang, Mengxi Zhang, Heng Dong, et al.
对语言模型进行红队测试以减少危害:方法、扩展行为与经验教训
Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.
FusionProt:融合序列与结构信息的统一蛋白质表示学习
Dan Kalifa, Uriel Singer, Kira Radinsky
LimiX:释放通用智能的结构化数据建模能力
Xingxuan Zhang, Gang Ren, Han Yu, et al.
epiGPTope:一种基于机器学习的表位生成与分类工具
Natalia Flechas Manrique, Alberto Martínez, Elena López-Martínez, et al.
GenCompositor:基于扩散Transformer的生成式视频合成
Shuzhou Yang, Xiaoyu Li, Xiaodong Cun, et al.
DCPO:动态裁剪策略优化
Shihui Yang, Chengfeng Dou, Peidong Guo, et al.
推理向量:通过任务算术转移思维链能力
Mohammad Zbeeb, Hasan Abed Al Kader Hammoud, Bernard Ghanem
Baichuan-M2:基于大型验证系统扩展医学能力
Baichuan-M2 Team, Chengfeng Dou, Chong Liu, et al.
VerlTool:面向具工具使用的整体性智能体强化学习
Dongfu Jiang, Yi Lu, Zhuofeng Li, et al.
ELV-Halluc:长视频理解中语义聚合幻觉的基准测试
Hao Lu, Jiahao Wang, Yaolun Zhang, et al.
MedChatZH:一个更优的医疗顾问通过更优的指令学习
Yang Tan, Mingchen Li, Zijie Huang, et al.
AlphaEarth Foundations:一种基于嵌入场的模型,用于从稀疏标签数据中实现精确且高效的全球制图
Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.
AetherCode:评估LLMs在顶级编程竞赛中获胜的能力
Zihan Wang, Jiaze Chen, Zhicheng Liu, et al.
TileLang:一种面向AI系统的可组合分块编程模型
Wang Lei, Cheng Yu, Shi Yining, et al.
Kimi-VL 技术报告
Kimi Team, Angang Du, Bohong Yin, et al.
DeepSeek-R1 思维学:让我们探讨 LLM 推理
Sara Vera Marjanović, Arkil Patel, Vaibhav Adlakha, et al.
基于双轴传播的多本体集成用于医学概念表示
Mohsen Nayebi Kerdabadi, Arya Hadizadeh Moghaddam, Dongjie Wang, Zijun Yao
使用协作式多Agent LLM架构从SOAP病历中自动检测临床问题
Yeawon Lee, Xiaoyang Wang, Christopher C. Yang
1
17
18
19
20
21
22
23
37