NLP算法面经14
10.15 携程 NLP(2+1)
1. 项目+实习
2. Lora原理以及初始化
3. Lora参数含义
4. Deepspeed三阶段
5. 强化学习框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型温度系数作用,topk和p的区别
9. bert的位置编码以及ROPE
10. 深入探讨Deepseek的技术
11. 深入探讨MOE和Dense模型
12. 代码题:接雨水
#大模型# #多模态人工智能# #nlp# #互联网大厂# #互联网大厂实习# #面经# #携程#
1. 项目+实习
2. Lora原理以及初始化
3. Lora参数含义
4. Deepspeed三阶段
5. 强化学习框架
6. PPO,DPO,GRPO
7. PPO的critic model作用
8. 大模型温度系数作用,topk和p的区别
9. bert的位置编码以及ROPE
10. 深入探讨Deepseek的技术
11. 深入探讨MOE和Dense模型
12. 代码题:接雨水
#大模型# #多模态人工智能# #nlp# #互联网大厂# #互联网大厂实习# #面经# #携程#
全部评论
Lora参数详解下
相关推荐
点赞 评论 收藏
分享
01-19 12:48
门头沟学院 C++
只想搞钱的鸽子很喜欢...:混账是很多的,还有那些在自己风华正茂的年纪说风凉话讥讽那些下岗前员工的。这些人都是现在职场环境这么烂的帮凶 点赞 评论 收藏
分享
