深言科技nlp算法日常实习二面分享
有面试过同岗的朋友欢迎评论区交流
1.项目细节
2.全量微调和sft rl
3.Dpo rlhf联系区别 ,dpo介绍,ppo和dpo的相似之处
4.prefill和decode的复杂度,kv cache
手撕
1.lc9 最长无重复子串
2.lc1143 最长公共子序列
1.项目细节
2.全量微调和sft rl
3.Dpo rlhf联系区别 ,dpo介绍,ppo和dpo的相似之处
4.prefill和decode的复杂度,kv cache
手撕
1.lc9 最长无重复子串
2.lc1143 最长公共子序列
全部评论
相关推荐
点赞 评论 收藏
分享
查看13道真题和解析