京东一面

一开始投递的不是这个岗位,但是这个是被Boss上的一个HR/招生组的人捞到了这个组,也是做Infra的组,但是没想到岗位居然是后端开发。

京东的面试也是比较曲折,因为自己的电脑是Linux单系统,本来是周二面试,结果面试前10分钟才发现面试需要装软件,还没有提供Linux版本的deb包,所以没法用电脑面试,然后拨打了邮件里的固定电话,和HR说明了情况调整到周三的同一时间了,而且第一次发邀约的时候,发来的几个时间都不合适,也找HR调整了时间,希望不会觉得我是一个不靠谱的人,邮件里写的面试时间是30分钟,但是实际上面试+手撕的总时间大概有70分钟,这场手撕的很慢也有原因

也是先简单过了简历,在我简单介绍完简历之后,先评价我说过往以及在校的项目传统软件的这个方向偏多,对于LLM Infra经验可能没有那么多,然后就是对项目中的Infra经历进行了一些询问,然后在聊了之后问我,之前有没有N卡的技术栈(因为Infra经历是在非N卡平台上做的),我说之前上课有契机写过几个CUDA Kernel的大作业,然后后续根据个人兴趣的情况,也简单学习了Triton算子的编写(为后续的离谱手撕埋下了伏笔

然后又聊了聊,除了实习经历中使用的推理框架,有没有了解过其他的推理框架,我说对SGLang也有所了解,SGLang的优势我觉得在KVCache的管理方面,它的RadixAttention机制比PageAttention对KV的复用率更高,所以对吞吐的提升可能更高,其他的特性vLLM和SGLang框架基本都会借鉴,两者在特性叠加方面我了解的差别不是很大,面试官也没有深挖,然后就是离谱的手撕了:

题目:用Triton编写FlashAttention,和面试官确认了qkv相关的stride都是默认为1,然后确认了一下输入参数,就开始编写,这个手撕写了起码有20分钟+,把kernel函数的加载&运算都写出来了,后面和面试官说后续就是把结果存回内存了,面试官就没有让我继续写了(真的很痛苦,后续看代码,发现有几个接口都用错了),整体逻辑没有很大的问题,大概就是利用分块加载&计算QKV,并且和面试官讲解了softmax防止溢出的策略,就差不多结束了

反问环节:base地、组里业务(面试官主动介绍),有三个方向:(1)框架侧推理优化&业务场景适配;(2)算子编译;(3)忘记了,好像是非N卡平台的推理?

然后面试官就问我的意向,对他们组是不是感兴趣,我说感觉还是蛮适合的,比较match的,对组里还是很感兴趣的,然后问了下后续流程的情况,说大概一周左右有反馈,一般需要一周左右的时间进行评估

买东西我只用京东,求东子哥发个offer吧

#秋招##发面经攒人品##我的秋招日记##京东##牛客AI配图神器#
全部评论
不懂为什么说岗位不匹配,感觉聊的挺顺的啊
点赞 回复 分享
发布于 09-20 14:32 浙江

相关推荐

评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务