NVIDIA AI Developer
5.10 一面
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda layernorm
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda layernorm
全部评论
这个是实习嘛
1
回复
分享
请问纯英文吗
送花
回复
分享
秋招专场
官网直投
加油
送花
回复
分享
相关推荐
投递英伟达等公司10个岗位 >
点赞 评论 收藏
转发
点赞 评论 收藏
转发
05-15 18:56
淘天集团_c开发(实习员工) 点赞 评论 收藏
转发
点赞 评论 收藏
转发
点赞 评论 收藏
转发