AI infra独角兽公司一面

1. 当训练推理卡规模倍增的情况下,最容易产生瓶颈的位置可能是什么
  a. 请展开分析产生的原因
  b. 对于此类问题,有什么优化或者缓解方案
2. 请解释并介绍一下 Roofline 模型,如何判断性能已经达到计算瓶颈
3. 在 C++中,若数组越界写使得其他的数据结构被写坏了,工程现场保留了 coredump 文件,你应该如何排查这个错误
4. 请介绍一下你理解的 Flash-attention
5. 当进行 GEMM 计算时,一定可以保证它是一个计算瓶颈算子吗,如果要你去优化它,你的思路是什么。
6. 对于性能优化的定位和瓶颈的检测,你有什么方法吗
7. 手撕:手写包含 GQA 的 attention 模块实现

#面经##infra#
全部评论
佬面的是minimax吗?怀疑我们碰到了一个面试官,第三题他也问过我。后续我二面挂了
2 回复 分享
发布于 2024-08-28 00:09 上海
佬,请问ai infra怎么入门呀,研0在纠结ai infra和搜推中
点赞 回复 分享
发布于 2025-02-11 23:47 山东
我测是真难啊 佬现在有拿到offer了嘛
点赞 回复 分享
发布于 2024-11-19 17:23 北京

相关推荐

03-26 10:52
已编辑
门头沟学院 算法工程师
📍面试公司:文远知行一面(更新2026/03/26挂)🕐面试时间:2026/03/20💻面试岗位:AI infra(时长1小时)❓面试问题:一、实习项目拷打10分钟,你在上一家公司做了什么二、八股1、PD分离机制,如何调度两个队列          ——回答PD区别,然后我如何设计调度策略,优先D,也保证P不被饿死2、vllm如何优化显存?                            ——讲了pageattention、continue batching、内存复用3、chunk prefill                                       ——分块计算,我感觉这个没啥好讲的,可能是针对padding吧4、什么是虚拟内存                                   ——这个很简单5、说一下进程和线程的区别,以及操作系统如何调度    ——这个也简单6、讲一下TCP\IP栈                                  ——说实话没听明白,后来询问之后是介绍TCP/IP模型7、追问如何通过IP地址进行通信(找到目标ip) ——这个我其实忘了,随便说了一下洪泛搜索,不知道对不对8、K8S拷打,简历上没写这个                   ——反正基本都不会,应该是炸了,只知道pod和container😓三、手撕(dfs+优化思路)给的测试数据不大,十分钟写了个O(N^N)的算法,运行没问题,然后要求优化成O(N^logN) ——想了很久,提示二分后没时间了,就没写了。四、反问1、我今天表现怎么样答:我感觉你没睡醒😂,状态不好。(我感觉这面试官也一直打哈欠)2、对我有什么建议吗答:简历都挺好的,技术上不应该只追求论文,你可以多了解一下K8S这些3、部门业务是啥答:我们组是做ai infra的,顶层可能是k8s负责调度大模型,中间有做算法优化,底层也有cuda算子优化吧。(这个                面试官介绍的挺详细的,我感觉他是负责K8S调度的)🙌面试感想:发挥不是很好,面试官人挺不错,感觉凉了大半截了,过几天看看结果吧。
查看12道真题和解析
点赞 评论 收藏
分享
评论
7
42
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务