26届春招 寒武纪 AIGC推理框架研发工程师

2025.4.13,二面,20min

  1. C++函数模板、规避内存泄露的方法
  2. torch compiler、cuda graph
  3. 是否了解 ptx

2026.3.25,一面,1h

  1. 推理框架研发工程师岗位的理解
  2. 降低大模型推理成本手段
  3. 为什么要做算子融合
  4. cuda graph 原理、作用、使用场景
  5. 3D 并行 & EP & CP & SP 原理、作用
  6. 模型量化类型、原理、作用
  7. 介绍MTP
  8. vllm的整体架构,请求在内部是如何流转的
  9. kvcache的空间如何计算
  10. prefix cache介绍
  11. vllm V0/V1 比较
  12. TP下,不同的模块如何汇总结果
  13. 口述multi head attention
  14. 一些git、pytorch相关的问题
#寒武纪##发面经攒人品##我的求职进度条#
全部评论
谁说没有3D并行!!
点赞 回复 分享
发布于 昨天 00:49 美国
最后通过了吗
点赞 回复 分享
发布于 04-18 23:50 北京
感觉聊的还行啊
点赞 回复 分享
发布于 04-18 23:50 北京
这问的还比较深
点赞 回复 分享
发布于 04-18 23:49 辽宁

相关推荐

04-17 16:18
厦门大学 Java
项目相关问题1. 介绍美食点评服务平台的业务场景、核心链路及基本实现。2. 美食点评服务平台的用户角色有哪些?不同角色可在平台上进行哪些操作?3. 美食点评服务平台除了优惠券秒杀模块,还有哪些功能?4. 美食点评服务平台的优惠券是由商家自主发放还是系统管理员添加?5. 做美食点评服务平台时面临的较大挑战有哪些?如何解决?6. 热点 Key 场景下,独立线程池异步重建是单机维度还是其他维度?请展开介绍。7. 异步线程重建的过程是怎样的?8. 美食点评服务平台是分布式服务还是单机服务?9. 分布式场景下,多台机器请求过期 Key 时,分布式锁何时释放?业务执行完的具体含义是什么?10. 访问 Redis Key 时,是请求进来就获取分布式锁,还是发现逻辑过期才获取?11. 介绍企业级知识库问答系统(RAG 项目)的整体流程。12. 企业级知识库问答系统中,哪些组件是手动代码串联实现,哪些是直接使用现有能力?13. 了解 Langchain 等现成工具的能力吗?它们能做到什么程度?14. 了解 Redis 的底层数据结构吗?跳表的实现原理是什么?编程能力相关问题1. 借助 AI coding 实现支持“增”和“查”功能的有序链表(增:插入数值;查:判断某值是否在链表中)。2. 插入 1、5、3、3、3 这 5 个数字后,有序链表会呈现什么样子?3. 手写 count 函数,返回目标值在链表中出现的次数,说明实现思路。4. 单纯从代码编写角度,如何优化 count 函数的性能(不引入其他数据结构)?其他问题1. 日常开发中常用的 AI coding 模型或工具是什么?2. 有什么想了解的地方吗?一点八股都没问,项目问的也奇怪,ai coding 后要我分析一下生成的代码质量,不知道怎么分析,求助一下贴友ai coding 是怎么个prompt 会让面试官满意,因为感觉我写不好提示词,然后要怎么评审这个代码的准确性,请教万能的贴友
查看20道真题和解析
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务