美团- 北斗计划-基座大模型推理引擎工程师

📍面试公司:美团
🕐面试时间:2025-08-14,菜只因秋招处女面
💻面试岗位:北斗计划-基座大模型推理引擎工程师
BG:末9本,中科院硕,和组内课题不相关
❓面试问题:
    自我介绍:一分钟完事
    1.介绍一下Transformer的架构,和传统RNN循环神经网络相比有何优势
    2.Transformer中参数都分布在哪里,参数量最大的是哪部分?计算量最大的是哪部分,为什么?
    3.了解GPU的cuda core、Tensor core吗,你常用的GPU有哪些,他们的显存和显存带宽有多大
    4.讲讲大模型的量化
    5.为什么需要PD分离技术
    6.讲讲PageAttention和Continous Batching技术
    7.讲讲cuda编程
    8.了解DeepSeek 的MLA机制吗?详细介绍一下和MHA、GQA、MQA的区别
    9.介绍一下DeepSeek MoE架构
    10.详细介绍一下各种并行方法,TP、PP、DP是什么
    11.为什么说Prefill阶段是计算密集型的,为什么Decode阶段是内存密集型的?
    #牛客AI配图神器#无寿司🍣,感觉是回答的太烂了,30分钟结束。
    反问:从刚才的面试来看,感觉是不是做底层系统优化比较多,是不是CUDA编程很多?
    答:也不全是。主要综合来看,不是一定要掌握CUDA编程,但是作为大模型开发而言,CUDA编程肯定要学的,
🙌面试感想:和蔼,有几道问题给我解释了;开始开了摄像头,后期关闭了摄像头;大模型八股偏多,依据简历问的,没问项目,我的项目是RAG,可能跟岗位关系不大,所以没问。
#面试问题记录##牛客创作赏金赛##美团##美团秋招笔试##大模型##给26届的秋招建议#
全部评论
这波八股拷打够狠,30 分钟结束像提前交卷了
点赞 回复 分享
发布于 2025-08-19 14:30 江苏
项目尽量往推理引擎靠,不然容易被问懵
点赞 回复 分享
发布于 2025-08-19 14:30 重庆
面试问题像并发请求,没答上来的都超时了
点赞 回复 分享
发布于 2025-08-19 14:30 四川

相关推荐

📍面试公司:小米🕐面试时间:2026/03/26(二十分钟草草收场,都不想去看结果就知道挂了)💻面试岗位:大模型推理优化❓面试问题:一、自我介绍二、八股问题拷打,其实上来就是手撕1、直接在编辑器上手撕MGA,要求写出init、forward、注意力层   ——丢人现眼了,基本不会写2、追问,不会写的话讲一下整个过程,输入到输出怎么样的?         ——讲了讲transformer,注意力机制3、vllm和sglang的底层代码有看过吗?                                          ——没看过(其实看过,但我不敢说,怕叫我写)4、kv cache有哪些加载方式?                                                        ——在胡言乱语,啊这个,啊那个5、PD分离机制是干什么的?你怎么实现的?                                   ——唯一能回答的问题6、有没有用vllm部署过模型?吞吐量是多少?                                 ——脑子昏了,沉默(跑了demo,没测过)7、MTP(可能是MCP?没听清)是什么,介绍一下?                     ——我估计想问Medusa?反正我没回答,沉默。到这他问不下去了。。。三、反问两个人尴尬一笑,没什么要问的了。🙌面试感想:应该是史上最无悬念的秒挂,第一个手撕不会之后我已经晕头转向了,加上昨天熬夜到五点,到后面我都有点不好意思了,感觉在浪费他的时间,在这里跟他道个歉😀。十月到现在算上开发+infra可能面了二十多家吧,大部分都是秒挂,感觉车企infra这块的要求都特别高吧,问的特别细,就是最新的技术一定都要掌握,这一块技术迭代感觉特别特别快,光背八股面经给我感觉不太行。鼠鼠也累了,但自觉已经尽力了。也感谢这些至少还给机会面试的公司吧,有些简历直接投垃圾桶里了。(希望下一届的同学早早准备,不要像鼠鼠一样还在为春招奔波)。
查看8道真题和解析
点赞 评论 收藏
分享
评论
7
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务