拼多多大模型应用开发一面凉经

继续来分享下之前的面经~欢迎友好讨论,信息共享
1. Lora微调的原理,涉及的参数和调试心得
2. DPO原理和涉及的参数作用
3. GRPO原理
4. 手写attention
5. 手写交叉熵
6. 手写最短的大于等于目标值的连续数组
全部评论
PDD面试是双机位嘛
点赞 回复 分享
发布于 04-05 17:53 辽宁

相关推荐

评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务