#大模型优化 - 前沿日报

标签

大模型优化

共 1 篇文章

使用小型草稿模型提前预测多个 token，用大型目标模型并行验证，无需牺牲输出质量即可实现 2-5 倍推理加速。本教程详解推测解码原理、Python 实现和 SSD 最新进展。

我的收藏