美团算法大模型二面-秋招面经

1.简历实习项目
2.有没有试过外挂数据库来解决线上业务数据分布更新较快的问题
3.模型选型问题,为什么选qwen3-8b,如何估算模型开销。
4.最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
5.推理加速的方法。(vlm的page-attention, kv cacheprefix cachemla, flash-attention等
6.场景题:忽略
7.代码题:k个一组反转链表
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务