4.21 官网投递 机器学习系统工程师蔚来这边不区分暑期和日常,说是只要有hc都可以转正5.8 上午 一面问项目,向量化的作用,transformer的性能瓶颈,cuda的优化方式,softmax的优化手段,矩阵乘的优化手段,这些优化手段都是怎么做的,矩阵乘的分块计算怎么做的,如果将矩阵乘和softmax放在一个kernel中怎么计算(看flash-attetion)八股(我的天,终于问八股了,虽然答得一般,之前面的压根没怎么问过):c11的新特性有哪些,详细说说,new和malloc的区别,在Linux中malloc是怎么分配内存的(说是什么双向链表,具体看cssapp)说是还有3、4个实习...