百度大模型应用算法实习一面
1. 简历深挖
围绕实习项目展开,问得很细,建议把自己做的每个模块的逻辑、贡献、思考都理清楚。
2. 理论基础
1.KL散度和交叉熵的关系?
2.介绍LoRA,和全参SFT怎么选?小模型SFT vs 大模型LoRA效果可能如何?SFT数据集怎么构建?
3.介绍AUC,它表达的是什么?
4.Recall重要的场景下,如果recall很高但precision很低怎么办?
5.Precision和Recall分别是什么?不同场景下如何权衡?哪个更重要?
3. 手撕代码
实现 shuffle 函数(注意洗牌算法的公平性和复杂度)
围绕实习项目展开,问得很细,建议把自己做的每个模块的逻辑、贡献、思考都理清楚。
2. 理论基础
1.KL散度和交叉熵的关系?
2.介绍LoRA,和全参SFT怎么选?小模型SFT vs 大模型LoRA效果可能如何?SFT数据集怎么构建?
3.介绍AUC,它表达的是什么?
4.Recall重要的场景下,如果recall很高但precision很低怎么办?
5.Precision和Recall分别是什么?不同场景下如何权衡?哪个更重要?
3. 手撕代码
实现 shuffle 函数(注意洗牌算法的公平性和复杂度)
全部评论
我去这是巨佬啊
相关推荐
点赞 评论 收藏
分享
等闲_:业务开发就是prompt+数据,Ai就是中间件,中台或者鸡架会做一些Agentic infra和智能体记忆之类的,再底层一点就是AI infra,MLops,模型微调,推理优化之类的了,所以对于普通后端就是纯业务,没啥技术含量,除非去技术架构组或者底层一点的组,要不AI就是个API,别神话AI应用开发 点赞 评论 收藏
分享

查看9道真题和解析