12.11 level
获赞
16
粉丝
16
关注
0
看过 TA
203
北京邮电大学
2026
算法工程师
IP属地:北京
暂未填写个人简介
私信
关注
有点久远了,今天刚二面,总结下。非常喜欢的面试官(一面),很帅很专业很聪明很落地很……(此处省略100字)。二面的leader没开摄像头,never mind,我就是个渣渣,无所谓的。记录下没答上来的点吧,大伙凑活看1. Deepseek部署:很落地,但是具体细节忘记了,当时没及时记录下来。这个很火,建议刚入门的朋友可以多看看dpsk新技术。2. Treereduece:不知道,只知道ringreduce3. mooncake:新技术,答到KTransformer(CPU+GPU异构加速)的时候,面试官提到的4. EP dispatch combine5. Pd分离 Deepseek - dual pipline chunked prefill6. 多卡分布式训推7. GEMM和GEMV实现和优化上的区别8. contiueous batching9. chunked batching10. Offloading:系统资源不够用的时候,卸载用不到的kvcache,或者没有被激活的专家等等11. GPU命中率场景:1. 分布式部署的时候怎么去解决io bound2. Deepseek- MoE 部署  EP TP 部署优劣对比评价:猜你没有看过vllm源码+对分布式了解还不够,然后也说了分布式需要资源,这也是实习的意义 二面:1. 为什么会有KVcache?为什么没有Q cache?(正好以前研究时候手撕过,设想一个你好的prompt,模型也回答你好,关键地方在于对于同样一个token,kv embedding的时候是同样的结果)2. Cuda除了gemm还做过哪些?(没有)3. 学这些东西用了多久?(两个月。。答长了,怕觉得我,学了这么久还这么垃圾。答短了,怕觉得我,才学这么点时间,垃圾。当然,长还是短,看他咯)4. 以后啥安排?会定居北京吗?(回答对象、父母安排,意向是留在北京,机会多些)提到租房,问我了解京东附近房价吗?(闲聊)5. 叫我做好准备,工作强度不低,弱弱的问了一句时间,大概是10-8,还行吧,和学习的时间比起来这都还好。6. 说我不够底层,确实吧,还得学啊,路漫漫其修远兮,吾将上下而求索参考连接:为什么加速LLM推断有KV Cache而没有Q Cache? - 莫叶何竹的回答 - 知乎https://www.zhihu.com/question/653658936/answer/107469197025Mooncake (1): 在月之暗面做月饼,Kimi 以 KVCache 为中心的分离式推理架构 - ZHANG Mingxing的文章 - 知乎https://zhuanlan.zhihu.com/p/705754254讲解的非常好,不是那么有基础的同学都可以试着了解一下【KTransformers 团队分享异构推理架构思路:基于内存的大模型推理成本优化】 https://www.bilibili.com/video/BV1VNQrYGEad/?share_source=copy_web&vd_source=0b7a45021acc545f42356bf3b2bb7080
查看17道真题和解析
0 点赞 评论 收藏
分享
中电信人工智能公司 大模型推理加速工程师实习生1. vllm sglang 有什么区别?sglang相对于vllm有什么好的?sglang为什么更适配推理这类的llm?dpskr1了解吗?和基座llm有什么区别?假如要魔改vllm,可以怎么做?2. Cuda算子开发经验,性能对比过吗?3. 大模型量化算法原理没问(感觉默认我懂)问有没有实际部署过?有没有看过autoawq的git库?4. Clip原理,clip推理流程了解吗?(简历里写了解过一些cv mllm方向)5. 实习经历介绍,实现的算子性能如何?常见大模型算子优化思路有哪些?(访存优化,并行优化)6. Ascend CANN MindIE框架有哪些组成?7. 场景1:V100显存多少,Dpsk Qwen 32B int8量化能部署吗?怎么部署?(紧张了,int8说2比特位…)8. 场景2:并发场景下怎么测试最大并发数,需要关注哪些指标?(答的不好)(bsz,latency 我回答的gpu利用率显存这些……面试官提示了从用户角度,我脑子没转过来)(指标含义没问,默认我懂)9. 场景3: vllm怎么去支持自研模型?面试官的建议:LLM有训练有推理,我们这个路子更偏向实现算法,加速算法。同样是attn,后端如何实现,如何更快。需要对算法有一定了解,对工程能力要求也挺高。我了解但是不够深入,实践经验较少。更深入去看vllm源码,应用层面怎么去调用算子,底层层面算子怎么实现的,怎么去实现更高性能算子(还提到可以从汇编层面出发)。关于暑期:电信(或者说国企)集团有统一的校招流程,需要投简历做笔试再分发简历到用人部门,没有直接内部转正的。个人感受:国企面试还是比较温和的,面试老师给我的感觉也是,知道你这个地方不会了,能力到这了,就不会再问了。呜呜呜,大厂全聚德的小垃圾(我)尸体暖暖的~#牛客AI配图神器#
12.11:补后续:hr说拉垮的点,没论文,实习时间短,不是大厂,内容垃圾不深入……
查看9道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客企业服务