百度LLM算法实习 面经分享

面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.模型量化INT8和INT4的区别
2.LoRA和Full Fine-tuning的区别
3.KV Cache的优化方法
4.手撕:反转链表
5.DPO和PPO的对比
6.RLHF的三个阶段
7.学习率warmup策略
全部评论

相关推荐

评论
2
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务