实习和项目 1.详细介绍实习工作2.模型迭代中遇到的难点, 解决方案3.序列中每个 item 是什么? 样本组织方式4.用户序列长短不一, 怎么处理5.推荐场景下的 id 特征, 会不会有 out-of-vocabulary 问题6.哈希冲突有什么影响7.介绍 attention, self-attention和cross-attention的区别8.业务场景有没有样本不平衡问题9.如何处理样本不平衡10.如何评估模型是否过拟合? 怎么缓解过拟合11.Dropout 是什么? 在训练和测试阶段有何区别12.在样本极不平衡的情况下, 可以用 AUC评估模型吗13.为什么用 transformer 建模用户行为序列, 而不是 LSTM14.了解哪些树模型15.介绍下 XGBoost, 相对 GBDT 有哪些改进codingleetcode 54. 螺旋矩阵 (hot100 中等题)反问