美团秋招大模型应用二面
1、介绍自己的中厂实习
2、一面的部分实习问题这里也问了。
3、有没有试过外挂数据库来解决线上业务数据分布更新较快的问题,
4、模型选型问题,为什么选qwen3-8b,如何估算模型开销。
5、最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
6、接触过哪些推理加速的方法。(vllm的page-attention, kv cache, prefix cachemla,flash-attention直接安排一套)
7、一个他们组里面的一个具体场景题。
8、手撕k个一组反转链表,并要求最后不足k个的也反转。
2、一面的部分实习问题这里也问了。
3、有没有试过外挂数据库来解决线上业务数据分布更新较快的问题,
4、模型选型问题,为什么选qwen3-8b,如何估算模型开销。
5、最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
6、接触过哪些推理加速的方法。(vllm的page-attention, kv cache, prefix cachemla,flash-attention直接安排一套)
7、一个他们组里面的一个具体场景题。
8、手撕k个一组反转链表,并要求最后不足k个的也反转。
全部评论
相关推荐
11-06 08:32
东北大学 Java 投票
牛客99209674...:你说你要是读博几年后,要延毕了,你是否回想起今天这个投票的时候呢
或者是如果选了京东测开,干几年就被裁员找不到下家,又是否回想起想要读博的那个早上呢
点赞 评论 收藏
分享
重生之我在潮汐监狱当...:有道理,公司出门往南走对一下
点赞 评论 收藏
分享
查看12道真题和解析