鹅厂实习一面 Ai infra

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1. 聊项目
2. 聊一下chunk prefill,他是为了解决什么问题而提出的
3. 说一下reduce-scatter和all-to-all通信
4. 怎么减少launch kernel overhead
5. cuda编程中bank conflict是什么,怎么解决?
6. 场景题:一个大集群中有节点内有nvlink,节点间部分机器有rdma,怎么去设计你的分布式推理方案
代码题:k个一组翻转链表
全部评论
感谢分享,大佬offer了吗
点赞 回复 分享
发布于 04-07 17:20 广东

相关推荐

继续来分享下最近的面经~1. 实习拷打2. 你做的RAG知识库,具体业务场景是什么?整体是怎么搭建起来的?3. 项目一开始存在大事务问题,这个问题具体怎么优化的?4. 这个知识库支持什么内容形态?只有图文吗?图片是怎么处理的?5. 知识库面向的业务是什么?图文混合内容是怎么存储和还原的?6. 知识库更新怎么做?怎么保证内容实时保鲜?7. 这个项目里你遇到过哪些挑战和技术卡点?8. 向量库选型时考虑过哪些方案?为什么最终选择Milvus?抛开公司基建,会从哪些维度选型?9. 简历里提到吞吐、检索性能有提升,提升具体来自哪里?你做了哪些优化动作?10. 当前链路访问量、文档量级、线上运行情况如何?灰度切量到什么程度了?11. 线上有没有完整监控?链路出问题如何及时发现告警?12. 灰度切流过程中实际暴露过哪些线上问题?怎么解决的?13. 你最近参与的个人用户向、AI Coding 相关产品,目前做到什么阶段?你负责哪部分?14. 在这些项目中,你个人最大的技术收获是什么?15. 你理解Milvus底层原理,这些原理在实际落地中怎么指导你的技术决策?16. ES深翻页问题有没有遇到过?背后原理和瓶颈怎么理解?17. 有没有做过高并发场景?大促、秒杀这类高并发场景一般怎么设计处理?18. 平时开发会用设计模式吗?在实际项目里是怎么落地使用的?
点赞 评论 收藏
分享
评论
6
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务