NVIDIA AI Developer
5.10 一面
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda layernorm
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda layernorm
全部评论
这个是实习嘛
加油加油
哥们方便交流下吗
加油
请问纯英文吗
相关推荐
03-15 18:52
华中师范大学 Java 淮竹c:不好意思,打扰大家🙏我是一个拼多多骑手,小电驴的最大电量为C,我的最大电量有1e9这么promax😭😭😭需要从x=0处走到x=L,L足足有1e9那么长处,途中有n个充电站,🙏🙏每个充电站的距离和电价分别为di和pi,初始电量是满的😭😭😭请告诉我到达终点最少要花多少钱😭😭😭求求大家把这些钱转给我
查看2道真题和解析 点赞 评论 收藏
分享
03-11 10:41
中国海洋大学 后端工程师 点赞 评论 收藏
分享
02-25 12:06
天津大学 嵌入式硬件工程师 点赞 评论 收藏
分享

