发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流项目拷打Transformer1.Transformer结构介绍2.自注意力机制介绍CUDA:1.Safe Softmax和普通softmax的区别?2.如何实现的online softmax科大讯飞iFLYTEK3.代码实现online softmax4.CUDA开发流程5.如何在CUDA上求一个数组的和?如何在CUDA上划分和合起来6.编译命令?nvcc有哪些常用参数?7.GCC有哪些参数?链接动态库?头文件查找路径?8.动态库和静态库的区别Pytorch:1.一个Tensor[1,2,3,4]想转成[4,3,2,1]有那些函数可以做到?(permute)2.介绍一个熟悉的继承自nn.Module的类推理加速中的FlashAttention了解吗?