April 18, 2026 April 18, 2026 April 18, 2026 April 18, 2026 DFlash:块级扩散式推测解码(Block Diffusion for Speculative Decoding)技术解析 DFlash:扩散草稿模型把 Speculative Decoding 推向并行高质量新平衡 核心解读 今天 GitHub Trending 上另一条非常值得关注的技术项目,是 DFlash 。它表面上看是在 speculative decoding 赛道上又增加了一种草稿模型实现,但如果仔细看,会发现它试图解决的是推 speculative-decodingblock-diffusioninference-optimizationvLLMagentic-inference