腾讯WXG 技术架构面经

一面

1. 项目介绍
2. 介绍MPS
3. 推荐模型训练技术, embeding和MLP的分离部署
4. 模型训练 数据并行的通信量, 通信算子
5. CUDA warp执行模式
6. transformer架构
7. 位置编码(问了, 但我说我不太了解就也没再细问下去)

二面

写代码, mem allocator
全部评论

相关推荐

点赞 1 评论
分享
牛客网
牛客企业服务