百度大模型训练一面-日常实习
1.项目拷打
2.手撕代码 leetcode 128
3.八股
介绍下vllm的技术点。
介绍下KV Cache,GQA,MQA,MHA
lora的原理,lora会不会更新原来的权重,如果对embedding层也配置了lora会不会更新。
topK和topP采样方法,采样温度的数值有什么意义
2.手撕代码 leetcode 128
3.八股
介绍下vllm的技术点。
介绍下KV Cache,GQA,MQA,MHA
lora的原理,lora会不会更新原来的权重,如果对embedding层也配置了lora会不会更新。
topK和topP采样方法,采样温度的数值有什么意义
全部评论
相关推荐
查看2道真题和解析 点赞 评论 收藏
分享