CSIG 暑期实习提前批 腾讯云-技术与产品方向 面经

总的来说是一个做交付的组,一面问的很杂,表现出来的像是主要做运维,解决一些客户的线上问题,做一些 docker 的打包交付,vllm/sglang 只是想知道简单的配置选项

二面自我介绍完之后ld直接问我方向不是很匹配会不会去,我说不会,就友好结束了

qit

腾讯云 - 技术与产品方向

a. 自我介绍,对某AI芯片厂的经历比较感兴趣

i. 讲一个实习中最有亮点的算子,遇到什么问题,怎么解决

ii. 遇到过什么坑吗?

iii. 性能怎么调试?模型 -- 看op占比,算子 -- 看关键代码

iv. 精度怎么调式?op -- 单测,模型 -- 逐层对比

v. 对训练有什么了解吗,你们在训练过程中是如何做加速的?Torch 分布式? -- 了解比较少

b. 怎么定位一个偶发的 bug,比如 vllm 里面 cuda 给你报一个 out of index,异步调用看不到准确函数栈

i. CUDA DEBUG 宏,阻塞之后可以准确看到出问题的地方,抓输入,debug kernel

ii. 追问:如果就是线上偶发的呢,客户给你的?-- 不知道怎么回答了

c. 怎么优化寒武纪 vllm 性能的 -- balabala

d. 对docker了解吗?打过包吗?K8s知道吗?打包的过程怎么尽可能减少层数和体积

e. 量化了解吗?Fp16 -> fp8 一定有提升吗?-- 首先硬件要支持,对部分矩阵乘可能起作用

f. 写题

i. Float sqrt 二分法,注意 0 - 1 之内的数

ii. 简单括号匹配

g. Linux - 一个进程为 D 代表什么

h. Python 语法

i. 什么时候用多线程什么时候用多进程? -- 知道 GIL 锁,会 block 住的用多进程

ii. 值传递还是引用传递?打错了,我说值传递,但是传的是对象的指针,对象可以被修改 -- 应该是全部引用传递,不可变变量传的是值的引用

iii. Async def?-- 讲了是用户态实现,底层不感知 https://zhuanlan.zhihu.com/p/698683843?share_code=ArOs4en6kUj9&utm_psn=2003149396813051736

iv. 如果要实现一个 LLM 的压测,用什么?Async,因为多线程开销很大;追问具体怎么实现,怎么控制并发数,比如10000数据量100并发?不知道语法,讲了可以搞个信号量之类的变量用 atomic 来控制并发量

i. vLLM

i. 性能评价标准 -- TTFT / TPOT

ii. 怎么在不增加资源的情况下减小 TTFT,有什么选项可以调?-- llm server 有关于 prefill / decode 优先级的选项用于控制 chunked prefill 之类的东西,可以使策略偏向 prefill 任务?

iii. 那你讲讲 chunked prefill -- balabala,提升了 decode 计算强度提高效率

iv. Cuda graph 在 vllm 里面的作用?-- 对固定 shape 的输入可以建图,减少 kernel launch 的开销,追问只是对 decode 加速吗?

#腾讯技术提前批##提前批##暑期实习#
全部评论

相关推荐

03-04 15:02
已编辑
南京大学 Java
3.3 一面岗位: 后台开发部门: 腾讯云场景题偏多,没问项目,没手撕,时长半小时1. 自我介绍2. Java基础:- Treemap & HashMap区别- ArrayList, 添加n个数(n较大),会发生什么(应该是想问ArrayList的扩容机制)- 考虑扩容的情况下这个过程的复杂度多少(说明复杂度计算思路即可,不需要给出具体的复杂度)3. 并发:- 项目里怎么用多线程的(一开始答了具体场景,不过面试官想听的是线程池,Synchronized这些...)- volatile & synchronized- 这里还问了一个,不过忘了...- 假设项目里用了很多synchronized拖慢了系统效率,让你重构项目,你怎么设计? (真不会,回了一个参考乐观锁的设计用版本号之类的,然后这个话题就过了)4. JVM- JVM垃圾回收,怎么判断对象有没有被引用? (可达性分析)- GC Root有哪些- 遇到OOM怎么排查5. 场景- 设计一个数据结构,用于在搜索框中搜索人名(不知道是不是这个意思,答了字典树这个结构)- 使用字典树存储的话空间复杂度是多少(同前面,给出计算思路就行,不需要具体的值)- 问了下简历上项目的背景,项目的具体内容没问- 项目里的难点/印象深刻的点,咋解决的- 针对上一点提了一个发散性的场景题(让你设计个xxx,你的思路)然后反问,无手撕。---春招第一面,被场景设计问题拷打麻了,就当练习了,不敢奢望能过,后续随缘了3.4更新,已挂
_追梦旅人_:大家考虑深圳睿联不,我们正在春招,可在我主页看岗位,感兴趣可直接投递~
查看15道真题和解析
点赞 评论 收藏
分享
评论
3
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务