Command Palette
Search for a command to run...

摘要
我们提出Seed Diffusion Preview,这是一种基于离散状态扩散机制的大规模语言模型,具备极快的推理速度。得益于非顺序的并行生成机制,离散扩散模型显著提升了推理效率,有效缓解了传统逐标记解码带来的固有延迟,这一优势已在近期研究中得到验证(例如Mercury Coder、Gemini Diffusion)。在H20 GPU上,Seed Diffusion Preview实现了2,146 token/s的推理速度,同时在一系列标准代码评估基准上保持了具有竞争力的性能表现,显著优于当前主流的Mercury与Gemini Diffusion模型,在代码模型的“速度-质量”帕累托前沿上树立了新的技术标杆。