nlp算法日常实习二面分享-深言科技
发点面经攒攒人品~
1. 项目细节
2. 全量微调和sft rl
3. Dpo rlhf联系区别 ,dpo介绍,ppo和dpo的相似之处
4. prefill和decode的复杂度,kv cache
手撕
lc9 最长无重复子串
lc1143 最长公共子序列
1. 项目细节
2. 全量微调和sft rl
3. Dpo rlhf联系区别 ,dpo介绍,ppo和dpo的相似之处
4. prefill和decode的复杂度,kv cache
手撕
lc9 最长无重复子串
lc1143 最长公共子序列
全部评论
相关推荐
04-16 10:20
武汉大学 后端工程师 点赞 评论 收藏
分享
点赞 评论 收藏
分享