美团算法大模型二面-秋招面经
1.简历实习项目
2.有没有试过外挂数据库来解决线上业务数据分布更新较快的问题
3.模型选型问题,为什么选qwen3-8b,如何估算模型开销。
4.最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
5.推理加速的方法。(vlm的page-attention, kv cacheprefix cachemla, flash-attention等
6.场景题:忽略
7.代码题:k个一组反转链表
2.有没有试过外挂数据库来解决线上业务数据分布更新较快的问题
3.模型选型问题,为什么选qwen3-8b,如何估算模型开销。
4.最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
5.推理加速的方法。(vlm的page-attention, kv cacheprefix cachemla, flash-attention等
6.场景题:忽略
7.代码题:k个一组反转链表
全部评论
相关推荐
查看17道真题和解析