Bilibili机器学习研发一面-实习面

发些面经攒攒人品
1. GPU算子优化通用方法论:profiling定性(memory/compute-bound)
2. 针对性优化(访存连续性/计算简化/block size调整)
3. 项目深挖,问得比较细,具体的优化过的部分都有问到
4. 分布式通信原语理解:all-reduce / all-gather / all-to-all 语义区分
5. 手撕CUDA编程:large array reduce sum 实现(shared memory归约 + 分层kernel设计)
6. 系统基础:进程/线程/协程概念
7. CPU调度粒度(进程级 vs 线程级公平性)
全部评论
很详细的面镜感谢分享
点赞 回复 分享
发布于 昨天 19:12 陕西

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务