10.15 携程 NLP(2+1)1. 项目+实习2. Lora原理以及初始化3. Lora参数含义4. Deepspeed三阶段5. 强化学习框架6. PPO,DPO,GRPO7. PPO的critic model作用8. 大模型温度系数作用,topk和p的区别9. bert的位置编码以及ROPE10. 深入探讨Deepseek的技术11. 深入探讨MOE和Dense模型12. 代码题:接雨水