日期

2 个月前

组织

论文 URL

标签

Cache-to-Cache（C2C）是由清华大学、香港中文大学联合无问芯穹等高校机构的研究团队于 2025 年 10 月提出的，相关研究成果发表于论文「Cache-to-Cache: Direct Semantic Communication Between Large Language Models」。

C2C 是一种新的 LLM 间直接语义通信范式，它使用神经网络将源模型的 KV 缓存投影并融合到目标模型的缓存中，以实现直接语义传递。与文本通信相比，C2C 利用了两个模型深层的、专业的语义，同时避免了显式的中间文本生成，成为基于 token 的交流方式的一种实用替代方案，并突显了其在可扩展、低延迟的多 LLM 系统中的潜力。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

Cache-to-Cache（C2C）

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Cache-to-Cache（C2C）

相关百科

SAC Flow

多编程语言 MoE 架构：MultiPL-MoE

SERES 语义感知稀疏视图重建框架

门控注意力 Gated Attention

猜测-思考-回答 Guess–Think–Answer

组方差策略优化 GVPO

多智能体工作流程 CudaForge

DiDi-Instruct 后训练方法

判别式约束优化框架 DisCO

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Cache-to-Cache（C2C）

相关百科

SAC Flow

多编程语言 MoE 架构：MultiPL-MoE

SERES 语义感知稀疏视图重建框架

门控注意力 Gated Attention

猜测-思考-回答 Guess–Think–Answer

组方差策略优化 GVPO

多智能体工作流程 CudaForge

DiDi-Instruct 后训练方法

判别式约束优化框架 DisCO

用 AI 构建 AI

HyperAI Newsletters

相关百科

SAC Flow

多编程语言 MoE 架构：MultiPL-MoE

SERES 语义感知稀疏视图重建框架

门控注意力 Gated Attention

猜测-思考-回答 Guess–Think–Answer

组方差策略优化 GVPO

多智能体工作流程 CudaForge

DiDi-Instruct 后训练方法

判别式约束优化框架 DisCO

相关百科

SAC Flow

多编程语言 MoE 架构：MultiPL-MoE

SERES 语义感知稀疏视图重建框架

门控注意力 Gated Attention

猜测-思考-回答 Guess–Think–Answer

组方差策略优化 GVPO

多智能体工作流程 CudaForge

DiDi-Instruct 后训练方法

判别式约束优化框架 DisCO