百度LLM算法实习 面经分享
面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.模型量化INT8和INT4的区别
2.LoRA和Full Fine-tuning的区别
3.KV Cache的优化方法
4.手撕:反转链表
5.DPO和PPO的对比
6.RLHF的三个阶段
7.学习率warmup策略
1.模型量化INT8和INT4的区别
2.LoRA和Full Fine-tuning的区别
3.KV Cache的优化方法
4.手撕:反转链表
5.DPO和PPO的对比
6.RLHF的三个阶段
7.学习率warmup策略
全部评论
相关推荐
点赞 评论 收藏
分享
查看7道真题和解析