百度大模型面经

1 自我介绍
2 项目介绍+拷打
3 八股
①deepseek( grpo、mla,追问了其他 )
②MHA、MQA、GQA
③Deepspeed( zero1、zero2、zero3),问是否了解混合精度(很具体,哪些部分用什么精度)除了这些还有什么减少显存占用的办法
④ppo、grpo、dpo
⑤lora的显存占用计算,全参的显存占用计算,项目里微调用到了多少显存
4 业务题
dpo数据量不够怎么构造
数据质量不好不使用人工怎么改善
5 代码题
一个路径转换题,非leetcode
全部评论

相关推荐

评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务