阿里菜鸟推荐算法实习面经
发一下问题给大家参考,攒攒人品!
1、实习拷打
2、简历项目介绍
追问:KL散度定义及公式
3、PPO原理
追问:技术选型,为什么选用PPO,其他强化学习方法是否了解
追问:PPO里的CLIP的作用是什么
4、RLHF
5、LoRA微调原理
6、LoRA正负样本构造
追问:为什么这么构造,利弊分析,如何改进
7、遇到过最大的困难是什么
8、八股:线程与进程的区别
追问:python多线程是否了解
追问:python全局锁GIL是否了解
追问:GIL设计的初衷是什么,源码是否了解
1、实习拷打
2、简历项目介绍
追问:KL散度定义及公式
3、PPO原理
追问:技术选型,为什么选用PPO,其他强化学习方法是否了解
追问:PPO里的CLIP的作用是什么
4、RLHF
5、LoRA微调原理
6、LoRA正负样本构造
追问:为什么这么构造,利弊分析,如何改进
7、遇到过最大的困难是什么
8、八股:线程与进程的区别
追问:python多线程是否了解
追问:python全局锁GIL是否了解
追问:GIL设计的初衷是什么,源码是否了解
全部评论
相关推荐
查看6道真题和解析