LLM算法实习 快手一面 30min

发一下问题给大家参考,攒攒人品!
八股
1. 大模型训崩了是什么情况、怎么解决
2. 模型推理性能怎么衡量
3. 什么情况下要进一步训练
4. 常用的模型微调框架
5. dpo和sft的区别,dpo有没有实际用过,分别适用于什么场景
6. 训练效果,xxx模型训练最终的效果,怎么优化的训练效果

 coding
最大子数组和
全部评论

相关推荐

评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务