【实习】高通一面复盘

项目经历之外,也问了基础和端侧 AI Agent 理解

这场高通一面整体给我的感觉是,节奏比较平,先从自我介绍和项目经历展开,然后慢慢转到计算机基础、Agent 理解、岗位匹配度和实习安排这些内容。不是那种一上来就连续追问很深的底层细节,更像是在确认你的背景是不是和岗位方向对得上,以及你是不是具备继续做这类工作的基础。

开头还是常规自我介绍。我主要讲了自己现在做的方向,包括 AI Infra、底层性能优化、算子开发、图优化这些,也讲了在一段 GPU 软件栈相关实习里做过的几类事情,比如算子性能优化、算子融合、稳定性问题排查,以及在学校里做过的一个量化推理 runtime 小项目。这里我还是尽量把重点放在“做了什么、为什么这么做、结果怎么样”上,而不是只堆关键词。比如我提到过用库实现替换手写算子来提升性能,也提到过针对图里的重算子链路做融合来减少数据搬运,还讲了一个长稳问题的排查和修复过程。

后面项目部分其实没有被问得特别发散,更多是在确认你到底是不是自己做过这些事。比如我讲到一个稳定性问题时,对方会更关心你是不是能说清楚问题是什么、你怎么定位的、最后结果有没有验证。讲量化项目时,也会关注你是不是真的理解 W4A16 这种思路,而不是只会说“量化能加速”。我这里讲的主线还是比较直接:权重压到更低比特,激活保持较高精度,通过减少权重存储和访存压力来换整体推理效率,同时再配合 profiling 去看瓶颈在哪、是不是还有融合空间。

比较明显的一点是,这场面试并没有一直停留在我原来的 AI Infra 背景上。面试官中途很明确地讲,他们这个岗位不是做模型本身的优化和量化,而是更偏 Agent、AI SDK、Framework 这一侧,尤其是端侧 NPU 上层的软件能力。所以后面的问题就开始往另外一个方向转,比如问我对现在一些常见 agent coding 工具有没有了解、有没有自己用过,平时怎么借助这些工具做事情。我这里主要讲了自己确实会用这类工具做一些辅助工作,比如读论文、提炼重点、生成一些小脚本,或者做一些求职信息收集和整理。但这一块我答得也比较老实,就是更多是使用层面,还谈不上很深入地研究过它们背后的实现。

除了项目和岗位方向,面试官还插了几组很基础的问题,像栈和队列的区别、进程和线程的区别、进程间通信、设计模式、内存泄漏的原因和处理思路。这部分给我的感觉是,他们还是会确认你的基本计算机素养,尤其是你不是科班出身时,对方会更自然地补这些问题。题本身不算难,更像是在看你是不是学过、是不是能把概念讲清楚。我自己的感受是,这类问题不一定决定上限,但如果答得过于零散,会影响整体印象。

最后聊得比较多的是岗位本身。对方介绍说,这个实习进去之后更可能接触的是端侧 NPU 上层的 Agent、AI SDK、Framework 和应用侧相关工作,也会关注怎么把现在流行的一些 agent 或 framework 能力更好地放到手机侧去跑。这个方向和我原来更偏推理优化、算子优化的背景不完全一样,但也不是完全断开,因为它依然和 AI 系统、框架、部署、端侧资源受限这些问题相关,只是更偏上层、更偏落地。整体下来,我觉得这场面试是在确认两件事:第一,你有没有技术基础;第二,你愿不愿意从原来偏底层优化的方向,往端侧 AI 软件栈和 Agent 这一侧延伸。

#面试复盘##实习##高通#
全部评论

相关推荐

04-03 11:26
已编辑
门头沟学院 后端工程师
查看20道真题和解析
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务