日期

2 年前

KV Cache 的全称是 Key-value Cache，它是大模型推理性能优化的一个常用技术，该技术可以在不影响任何计算精度的前提下，通过空间换时间思想，提高推理性能。 KV Cache 是 Transformer 推理性能优化的一项重要工程化技术，各大推理框架都已实现并将其进行了封装（例如 transformers 库 generate 函数已经将其封装，用户不需要手动传入 past_key_values）并默认开启（config.json 文件中 use_cache=True）。

参考来源

【1】https://zhuanlan.zhihu.com/p/630832593

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

日期

2 年前

参考来源

【1】https://zhuanlan.zhihu.com/p/630832593

Cache-to-Cache（C2C）

C2C 通过转换和融合模型间的键值（KV）缓存，实现直接的语义交流。

2 个月前

表征自编码器 Representation Autoencoders

RAE 凭借明显优势有望成为扩散 Transformer 训练的新默认选择。

3 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

KV Cache

参考来源

用 AI 构建 AI

HyperAI Newsletters

Command Palette

KV Cache

参考来源

Cache-to-Cache（C2C）

表征自编码器 Representation Autoencoders

用 AI 构建 AI

HyperAI Newsletters

Command Palette

KV Cache

参考来源

Cache-to-Cache（C2C）

表征自编码器 Representation Autoencoders

用 AI 构建 AI

HyperAI Newsletters

Cache-to-Cache（C2C）

表征自编码器 Representation Autoencoders

Cache-to-Cache（C2C）

表征自编码器 Representation Autoencoders