日常实习-小红书广告算法一面
1. 实习介绍+介绍论文 (挖了好多论文相关的问题
2. 手撕快排
3. 介绍一下 DQN和double q-learning
4. 二分类用什么loss,写一下BCE
5. 为什么MSE不能用于二分类
6. 深度学习有什么优化器,Adagrad、Adam和SDG的区别是什么
7. 介绍一下Transformer,encoder的FFN有什么作用,attention为什么要除以根号d_k
8. 介绍一下LoRA,为什么能高效微调,其中降秩的作用是什么
9. 介绍一下MoE,极化问题怎么解决
10. PCA算法的原理是什么
11. XGBoost和LigthGBM的区别
12.反问
2. 手撕快排
3. 介绍一下 DQN和double q-learning
4. 二分类用什么loss,写一下BCE
5. 为什么MSE不能用于二分类
6. 深度学习有什么优化器,Adagrad、Adam和SDG的区别是什么
7. 介绍一下Transformer,encoder的FFN有什么作用,attention为什么要除以根号d_k
8. 介绍一下LoRA,为什么能高效微调,其中降秩的作用是什么
9. 介绍一下MoE,极化问题怎么解决
10. PCA算法的原理是什么
11. XGBoost和LigthGBM的区别
12.反问
全部评论
相关推荐
点赞 评论 收藏
分享
11-29 18:48
福州大学 golang 点赞 评论 收藏
分享
