腾讯音乐 暑期实习 nlp 二面

1.问项目

2.场景题+八股

大模型幻觉问题怎么解决

RAG模型的一些问题 怎么解决

大模型微调用的什么框架?

deepspeed的zero1 2 3

llama的7b模型显存占用情况 参数量到显存占用如何换算?

Lora的原理 为什么不在layernorm层也做lora? embedding层能不能用lora?

layernorm在训练和推理时有什么不同?

3.问了一些个人的情况

#面试经验##算法面试经验分享#
全部评论

相关推荐

点赞 5 评论
分享
牛客网
牛客企业服务