美团秋招大模型应用二面
1、介绍自己的中厂实习
2、一面的部分实习问题这里也问了。
3、有没有试过外挂数据库来解决线上业务数据分布更新较快的问题,
4、模型选型问题,为什么选qwen3-8b,如何估算模型开销。
5、最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
6、接触过哪些推理加速的方法。(vllm的page-attention, kv cache, prefix cachemla,flash-attention直接安排一套)
7、一个他们组里面的一个具体场景题。
8、手撕k个一组反转链表,并要求最后不足k个的也反转。
2、一面的部分实习问题这里也问了。
3、有没有试过外挂数据库来解决线上业务数据分布更新较快的问题,
4、模型选型问题,为什么选qwen3-8b,如何估算模型开销。
5、最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
6、接触过哪些推理加速的方法。(vllm的page-attention, kv cache, prefix cachemla,flash-attention直接安排一套)
7、一个他们组里面的一个具体场景题。
8、手撕k个一组反转链表,并要求最后不足k个的也反转。
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看11道真题和解析
