滴滴LLM大模型实习一面凉经

自我介绍
提问项目:
1.gspo和grpo区别,损失函数
2.ppo和grpo区别
3.强化学习的理解(reward是否需要某一步突然特别好等等)
4.策略模型和参考模型如何设计
5.rag的架构,如何分块

八股:
1.transformer结构
2.介绍一下微调有哪些
3.为什么更多用lora这种泛式,而不是prefix tuning

手撕:lc 旋转图像
全部评论

相关推荐

LastWh1spe...:ssob真有些人和那个没睡醒一样
点赞 评论 收藏
分享
01-30 09:45
燕山大学 Java
喵_coding:这种直接跑就完事了 哪有毕业了才签合同 任何offer和三方都没有的
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务