draft模型与target模型在同一家族(如Llama-7B draft + Llama-70B target)
输入prompt和输出内容分布多样(draft模型接受率低)
使用更大的k值(每次draft更多token)
在单一领域数据(如代码)上使用专门训练的draft模型
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题