攒攒人品!有面试过同岗的朋友欢迎评论区交流1. 项目拷打2. 拷打第一段实习2.1 模型优化细节,非常细,基线模型结构、具体优化点、expert数量,输入维度,参数量计算,特征分配策略等等2.2 参数量增加后,计算量增加了多少?FLOPs和训练速度分别怎么变化?2.3 模型性能跟模型大小是相关的吗?2.4 新增的存储属于什么类型?在PS中仅增加存储是否影响训练推理速度2.5 存储成本和查询成本哪个更高?新增参数量是否达到瓶颈?2.6 相同的机器下,训练速度慢了多少?或者增加了多少机器才能让训练速度持平?3. 拷打第二段实习3.1 主模型细节,序列建模细节,模型参数、序列长度3.2 OneTrans的优缺点4. 手撕代码:求数组中第K大的数,时间复杂度要求O(N)