拼多多大模型应用开发一面凉经
继续来分享下之前的面经~欢迎友好讨论,信息共享
1. Lora微调的原理,涉及的参数和调试心得
2. DPO原理和涉及的参数作用
3. GRPO原理
4. 手写attention
5. 手写交叉熵
6. 手写最短的大于等于目标值的连续数组
1. Lora微调的原理,涉及的参数和调试心得
2. DPO原理和涉及的参数作用
3. GRPO原理
4. 手写attention
5. 手写交叉熵
6. 手写最短的大于等于目标值的连续数组
全部评论
PDD面试是双机位嘛
相关推荐
查看11道真题和解析