1987我不知会遇见你

03-17 10:14 已编辑深度学习

关注

AI深度学习算法推理加速CUDA HPC类岗位-英伟达面经

前几天才面了下nvidia，面试官问了一堆底层问题，好多没答上来...

这次记录下，欢迎大家一起讨论...

哈哈标题党了，我其实不是学生，分享一下我作为一名面试官常问的AI推理加速HPC岗位的问题~仅分享通用知识部分，项目部分因人而异这里省略

C++部分

1、为什么我们做C++项目的时候，需要写头文件？

2、讲出static关键字的一种应用场景

3、单例模式如何实现？

4、讲讲四种类型转换

5、拷贝构造函数中浅拷贝和深拷贝的区别？

6、一个类要去访问另一个类的private数据成员，该如何操作？

量化quantization部分

1、说说你知道的那些针对LLM的量化技法？

2、smoothquant为什么可以解决int8 LLM的accuracy问题？

3、bfloat16和fp16(half float point)同样内存大小，那么它们可以节约的内存大小应该是一样的吗？他们的优缺点主要有哪些？

4、量化怎么平衡精度和速度？

CUDA部分

1、讲讲shared memory bank conflict的发生场景？以及你能想到哪些解决方案？

2、CUDA里面如何分配GPU显存？为什么里面的参数是二级指针？

3、优化CUDA程序的访存效率，你可以想到哪些？

4、优化CUDA程序的计算效率，你又可以想到哪些？

大模型部分

1、有哪些encoder-only、decoder-only、encoder-decoder的模型？

2、随着seqlen的增加，你觉得encoder-only的模型和decoder-only的模型的计算量和访存量会是哪些变化趋势？为什么？

3、说说你知道的大模型训练or推理的常用优化手段

4、一般会对哪些大模型里面的算子做算子融合，说说你知道的

5、flash attention的原理讲讲？你认为为什么flash attention极大提升了训练速度？

6、paged attention的原理讲讲？你认为为什么paged attention极大提升了推理速度？它和flash attention的区别是什么？

以上呢，起始都是非常经典的问题，足够看出大家对AI推理加速HPC岗位的基础。

本人知道最近大家忙着准备实习面试和几个月后的秋招面试，同时很多学弟学妹深陷AI算法和后端开发的泥沼，认为只存在这俩职位，本人当初作为应届生的时候也是这样，但其实不然，AI深度学习推理加速HPC类岗位随着nvidia的股价暴涨，需求也是越来越大的，我从去年开始就帮助了很多同学了解这方面、加入这方面、着手实践项目，很多去年都成功拿到了offer，因此欢迎大家ping我，祝大家龙年工作如意~附一些截图

全部评论

推荐最新楼层

牛客978617443号

C++

大佬你好，请问公众号是什么？

1 回复

发布于 03-07 14:32 上海

牛客125465453号

111

狠狠的赞了

点赞回复

发布于 03-27 15:30 北京

联易融

校招火热招聘中

官网直投

04-19 20:27

已编辑

深言科技_大模型数据_数据开发(实习员工)

NVIDIA SONiC测开面经已oc

timeline一面 3.111. 英文自我介绍2. 英文介绍项目3. ARP协议 已知目的ip 获得MAC地址5. MAC地址表 ARP缓存表6. 路由协议是如何转发的 路由表7. DNS协议 过程8. Linux命令 如何配置本机ip9. Python题 写一个可以传入一个执行次数的参数的装饰器 给出平均执行时间 三层装饰器10. 算法题 两数相加二面 3.18 线下1. 中文自我介绍2. 聊了聊研究方向3. 聊了聊以前做过的竞赛4. 聊了聊实习5. 英文提问 路由协议 跨广播域 怎么获取MAC地址 问的非常细节 会让你说出底层实现和相关的linux指令6. 英文提问 VLAN用过吗 怎么...

点赞评论收藏

转发

04-20 23:07

复旦大学计算机类

不懂机器学习能否投模型框架/引擎开发？

无AI背景，但是比较熟悉CUDA，请问是否可以投递框架开发、高性能计算相关的实习岗位呢？因为我看 jd 里都要求熟悉机器学习/深度学习... 现在补习机器学习/深度学习的话是否来不及了啊

点赞评论收藏

转发

地平线官方内推码_rdpnvz

04-16 20:16

已编辑

地平线内推含工作体验

地平线春季2025届实习生招聘正式启动 ！ 继续为牛友们内推，有任何问题可以评论区或者私信联系，内推后可以评论区留言岗位+姓名缩写方便跟进进度 【关于地平线】 以"赋能机器，让人类生活更安全、更美好"为使命，地平线是行业领先的高效能智能驾驶计算方案提供商。作为推动智能驾驶在中国乘用车领域商业化应用的先行者，地平线致力于通过软硬结合的前瞻性技术理念，研发极致效能的硬件计算方案以及开放易用的软件开发工具，为智能汽车产业变革提供核心技术基础设施和开放繁荣的软件开发生态 【公司周围环境】 最近4月初，北京春天来了，IC-PARK周围很多花都争先开放，姹紫嫣红，美不胜收 【...

点赞评论收藏

转发

牛客464628842号

04-01 10:02

中国科学院大学计算机类

推理部署优化/高性能开发春招总结-1

腾讯    一面        1. Tensorrt-LLM, AGI , VLLM源代码区别        2. 为什么要有continue batch        3. fastllm.cpp 的源代码        4. yolo加速        5. Python 计算密集型使用多进程还是多线程        6. C++继承怎么实现的        7. 最大子数组之和    二面        1. 求比特位中1个个数        2. 编译时运行        3. VLLM ，PageAttention        4. Cuda 内存模型介绍        5. 使用triton 实现 PageAttention    二面挂#金三银四，你有感觉到吗##春招提前批，你开始投了吗#

金三银四，你有感觉到吗春招提前批，你开始投了吗

点赞评论收藏

转发

Leon201904262046230

04-17 11:35

已编辑

C++

美团校招生算法岗入职--附面试准备指南

美团算法岗入职啦！入职一个月体验挺好，团队不卷，早10晚8。写一下自己的面试经验，供大家参考！期望大家都找到自己心仪的实习/校招offer！ 下面附上自己总结的面试准备经验： 1.算法题 算法题肯定是最重要的，残酷的现实就是笔试成绩不行，面试机会都没有，所以要准备秋招了最好提前开始刷算法题。至于用什么平台，个人觉得无所谓，我就用的leetcode，一开始刷剑指offer和LeetCode75，当然都没有刷完，然后看到这个宝藏链接*******************************3797/article/details/12397813 ，这里面的题按类别挨个看，没有都做，因为时间...

我发现了面试通关密码你收到了团子的OC了吗

点赞评论收藏

转发

9 87 评论

全站热榜

正在热议

# 牛客帮帮团来啦！有问必答 #

334640次浏览 7051人参与

# 晒一晒我的offer #

2749298次浏览 49381人参与

# 华为求职进展汇总 #

430616次浏览 4321人参与

# 第一次面试 #

12871次浏览 198人参与

# 非技术岗薪资爆料 #

3985次浏览 94人参与

# 机械人怎么评价今年的华为 #

46571次浏览 372人参与

# 你更愿意参加线上面试还是线下面试？ #

3359次浏览 45人参与

# 来聊聊机械薪资天花板是哪家 #

17050次浏览 129人参与

# 应届生应该先就业还是先择业 #

10395次浏览 102人参与

# 找工作，你会甘心进小厂还是猛冲大厂 #

21702次浏览 208人参与

# 百度工作体验 #

18860次浏览 205人参与

# 为什么那么多公司毁约 #

31893次浏览 267人参与

# 实习工作，你找得还顺利吗？ #

4692次浏览 69人参与

# 除了offer，现在你还缺点啥？ #

1774次浏览 41人参与

# 讲讲我经历过的年终奖 #

5754次浏览 76人参与

# 通信硬件人笔面经互助 #

58403次浏览 1318人参与

# 如果校招重来我最想改变的是 #

69725次浏览 1374人参与

# 通信硬件薪资爆料 #

132525次浏览 895人参与

# 租房前辈的忠告 #

19561次浏览 1567人参与

# 机械人的薪资开到多少，才适合去？ #

41337次浏览 245人参与

牛客网
牛客企业服务