Command Palette
Search for a command to run...
Cache-to-Cache(C2C)
Cache-to-Cache(C2C)是由清华大学、香港中文大学联合无问芯穹等高校机构的研究团队于 2025 年 10 月提出的,相关研究成果发表于论文「Cache-to-Cache: Direct Semantic Communication Between Large Language Models」。
C2C 是一种新的 LLM 间直接语义通信范式,它使用神经网络将源模型的 KV 缓存投影并融合到目标模型的缓存中,以实现直接语义传递。与文本通信相比,C2C 利用了两个模型深层的、专业的语义,同时避免了显式的中间文本生成,成为基于 token 的交流方式的一种实用替代方案,并突显了其在可扩展、低延迟的多 LLM 系统中的潜力。
