NVIDIA AI Developer

5.10 一面
1. 介绍lora
2. nvidia 多进程和线程 + 流(说了一个用MPS比较hack的做法, 面试官给出了一个线程 + stream的做法)
3. GPU上的存储, global memory, local memory, shared memory, register的大小, 带宽, 访存延迟大概是在什么级别
4. 手撕, cuda  layernorm
全部评论
这个是实习嘛
点赞
1
回复
分享
发布于 05-16 17:30 日本
请问纯英文吗
点赞
送花
回复
分享
发布于 05-18 19:26 上海
秋招专场
校招火热招聘中
官网直投
加油
点赞
送花
回复
分享
发布于 05-20 10:29 山东

相关推荐

1 12 评论
分享
牛客网
牛客企业服务