美团北斗AI infra校招面经
攒人品中~
1.介绍一下Transformer的架构,和传统RNN循环神经网络相比有何优势
2.Transformer中参数都分布在哪里,参数量最大的是哪部分?计算量最大的是哪部分,为什么?
3.了解GPU的cudacore、Tensorcore吗,你常用的GPU有哪些,他们的显存和显存带宽有多大?
4.讲讲大模型的量化,讲量化算子
5.详细讲pd分离
6. 详细讲paged atten
7.LC25题:K个一组翻转链表
8.写cuda算子:前缀和。实现一个base的,讲优化方法
9.写cuda算子gemm:实现一个base的,讲优化方法
1.介绍一下Transformer的架构,和传统RNN循环神经网络相比有何优势
2.Transformer中参数都分布在哪里,参数量最大的是哪部分?计算量最大的是哪部分,为什么?
3.了解GPU的cudacore、Tensorcore吗,你常用的GPU有哪些,他们的显存和显存带宽有多大?
4.讲讲大模型的量化,讲量化算子
5.详细讲pd分离
6. 详细讲paged atten
7.LC25题:K个一组翻转链表
8.写cuda算子:前缀和。实现一个base的,讲优化方法
9.写cuda算子gemm:实现一个base的,讲优化方法
全部评论
相关推荐
查看12道真题和解析