辉羲智能 NPU算子开发实习生 面经

Time line
3.12 一面 hr面
3.13 二面 技术面
3.17 三面 技术面
3.24 oc

一面
主要就是聊聊天,介绍公司基本情况以及薪资待遇(正常来说,这不应该三面么)

二面
1.简单介绍一下你自己
2.拷打项目,几种常见卷积算法的优缺点
3.写算子时有碰到bank conflict吗?为什么会发生bank confict以及如何解决?
4.说一下CPU和GPU的架构
5.说一下你对grid,block,thread的理解
6.写算子时如何最大化地利用缓存?
迭代一次的数据尽量符合L1的大小,整个程序的数据尽量符合L2的大小。(当时我的回答)
7.你知道线程束分歧吗?(warp divergent 也叫线程束分化)
8.手撕矩阵乘算子(当时我打开vscode,他看了我写的reduce以及conv2d,于是便叫我写一个矩阵乘)
第一次技术面,有点紧张,在面试官的提示下顺利写出naive版本,然后说自己对后面的优化,以及如何确定最佳分块大小。过程中还问了blockDim.x和gridDim.x最大能开多少。
反问环节

三面
感觉和二面差不多,主要也是拷打项目
不同点:
1.共享内存和cache的区别
2.你了解Tensor core吗?它和CUDA core比加速矩阵乘谁更快?
3.你了解Transformer吗?
4.softmax算法在深度学习中的应用
5.手撕softmax算子(有了经验后,十分顺利)
反问环节

最后祝大家都能顺利找到实习

#面经##实习##算子开发##CUDA#
全部评论
1 回复 分享
发布于 2025-03-31 21:25 四川
1 回复 分享
发布于 2025-03-27 15:08 四川
我为大佬打call
1 回复 分享
发布于 2025-03-27 15:03 四川
佬请问你项目准备的是啥呀
点赞 回复 分享
发布于 2025-04-11 11:37 北京
佬是硕吗
点赞 回复 分享
发布于 2025-04-07 22:12 黑龙江
点赞 回复 分享
发布于 2025-03-27 15:33 四川

相关推荐

1.pinia应用于什么样的状态场景,偏技术侧。抛开pinia有哪些状态场景(项目内容)2.组件传递状态场景,除了pinia(八股)3.provide的传递方式具体的怎么实现的(八股)4.provide和inject这两种方法的功能(八股)5.基于策略模式的组件化架构是怎么样的?举一个例子说(项目内容)6.这个策略大概配成什么样?实现什么样的功能?(项目内容)7.智能聊天客服模块是用AI进行对话的吗?(项目内容)8.流式的逐字展示是怎么实现的?(项目内容)9.为什么用websocket做实时通信(项目内容)10.流式输出除了websocket还有其他的实现方式吗?(八股)11.怎么理解基于路由映射的动态请求架构?(项目内容)12.统一鉴权是怎么做的?(项目内容)13.token存储除了localstroge还有哪里?(八股)14.为什么考虑放localstroge?(项目内容)15.localstroge还存啥了?(项目内容)16.localstroge不会很大吗?(项目内容)17.localstroge最大能存多大?(八股)18.万一超了呢?(项目内容)19.除了localstroge还知道哪些持久化缓存的内容?(八股)20.介绍一下Zod(项目内容)21.为什么要重构轮胎厂项目成vue3?(项目内容)22.怎么重构的?详细说说如何借助AI工具重构?(项目内容)23.总结出用AI coding的经验?(项目内容)24.知道spec coding这个概念吗?web coding呢?(八股)25.skill和mcp的区别?(八股)26.代码有多少是手写的,有多少是AI写的?27.CSS中的Flex布局怎么实现两侧布局?(八股)28.如何理解绝对定位和相对定位?(八股)29.实现一个二叉树的遍历(二叉树的结构:const node ={left: leftNode, right: rightNode, value: 'xx'})按照二叉树的结构输出所有的二叉树value
查看29道真题和解析
点赞 评论 收藏
分享
评论
10
29
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务