寒武纪pytorch架构开发

💼公司岗位
👥面试题目
🤔面试感受
#社招#

1.简历介绍
yolo项目介绍
如何处理误报和误检问题
gpu不够怎么处理
fp16和fp32
模型调参和模型裁剪怎么做的
pytorch original memory(这里忘记了 完全不知道)
2.cnn感受野概念
transomer和cnn区别和用法
self- attention里的开根号原因

熟悉cuda嘛?写过cuda嘛?
写过算子嘛?

结论:不是很match,不继续面了

只能回忆起这么多了 相关同学加油👏!

分享面经 保佑🙏offer早点拿到待审核的公司offer…
🙏🙏

#算法面试分享#
全部评论

相关推荐

11-17 10:23
门头沟学院 Java
月薪多少能在一线城市生存
点赞 评论 收藏
分享
面试岗位AI软件开发面试官一副肥头大耳(虽然评论外貌有点不妥,但是忍不住了),语气中给人透露着傲慢,感觉参加的不是面试,而是一场羞辱,承受着他工作中的不顺。开局介绍项目,然后说你这个C++还能编译为arm架构?用的什么编译的?arm指令版本是什么?cmake编译时能看到arm参数吧,你设的参数是什么?在你这arm机器上还能运行python?你这里提到了npu,他的具体型号是什么?他内存布局是什么样子?存储层级是什么?他的内存可以改吗?你说npu共用操作系统内存,NPU存储和ARM存储有什么区别?(WCNM,实习干的就是上层应用,谁TM关注底层NPU,而且这是我能接触到的吗?要不要我去把NPU图纸偷出来给你看,开局一套组合拳给我干麻了?语气就是,你真的在这里实习过?)接着八股期间让先介绍Transformer多头注意力机制,介绍完之后,他说我要的是你介绍他里面怎么算的,我???(我不是刚介绍过了吗,包括QKV矩阵和点击注意力和多头怎么切片),我说我刚才介绍了,然后又重复了一遍他的问题,我要的是多头注意力怎么计算的?我愣了,我说那我在白板上演示下每一步怎么计算以及得到的结果的维度,他说不用,你就语言说一下多头注意力怎么计算,我说的还不够清晰?听不懂?后面的八股包括但不限于大模型训练用什么优化器,adam相较于SGD的优点,ADAM里面动量是什么,怎么更新计算,交叉熵损失的物理意义是什么?介绍一下pytorch里面的**和**模式(没听过,没记住),介绍pytorch indicator,pytorch支持的模型并行化方法有哪些,在数据并行和模型并行的时候,哪些模块消耗显存?模型量化方法有哪些?模型训练时链式求导怎么算的,不要说数学推导,有两个fc层的残差结构,链式求导怎么求?介绍python gc模块,python中怎么解决循环引用。yield和yield from的区别是什么?cpp模版里的内存萃取是什么?模版特化是什么?python和cpp多线程有什么区别?Python线程和协程有什么区别?python里异步调用和同步调用区别是什么?其中很多都没答上来,最后快结束的时候说,那我们问个简单的,都知道的东西,在x86的cpu中,为什么一个核心通常都是有两个线程。(我不知道,在这一刻,仿佛失去了所有的力气和手段)固然,我是个彩笔,达不到你们的招聘要求,但是有必要这样的压力吗?面完心态直接炸穿了。
查看30道真题和解析
点赞 评论 收藏
分享
评论
点赞
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务