百度大模型训练一面-日常实习
1.项目拷打
2.手撕代码 leetcode 128
3.八股
介绍下vllm的技术点。
介绍下KV Cache,GQA,MQA,MHA
lora的原理,lora会不会更新原来的权重,如果对embedding层也配置了lora会不会更新。
topK和topP采样方法,采样温度的数值有什么意义
2.手撕代码 leetcode 128
3.八股
介绍下vllm的技术点。
介绍下KV Cache,GQA,MQA,MHA
lora的原理,lora会不会更新原来的权重,如果对embedding层也配置了lora会不会更新。
topK和topP采样方法,采样温度的数值有什么意义
全部评论
相关推荐
02-17 16:34
东北大学 算法工程师 有气魄的coder才...:实习就去讯飞吧,起码学点东西,秋招找别的,联想貌似暑期实习转正很难吧,感觉hc很少,秋招也能投。
点赞 评论 收藏
分享
查看14道真题和解析