继续来分享下之前的面经~欢迎友好讨论,信息共享1. 介绍一下Attention机制,如何计算Query和Key的相似度?(Dot-Product、Cosine、MLP等)2. 对比Adam和SGD,什么情况下SGD更优?(泛化性、调参难度)3. 推荐模型中的Embedding层维度如何选择?(经验公式:dim = 6 × (feature_cardinality)^0.25)4. 如何解决推荐系统中的长尾分布问题?(Focal Loss、Sampling策略、Two-Phase Training)5. 对比DIN(Deep Interest Network)和DIEN(Deep Interest Evolution Network),DIEN如何建模用户兴趣演化?6. 广告排序模型(CTR/CVR预估)常用的特征有哪些?(用户特征、广告特征、上下文特征、交叉特征)7. 广告系统中的出价策略有哪些?(CPC、oCPM、oCPC的区别)8. 如何解决广告主预算受限下的流量分配问题?(PID控制、Pacing算法)9. 广告拍卖机制(GSP vs. VCG)的区别?为什么工业界常用GSP?10. 如何防止广告系统的点击欺诈?(反作弊模型、IP/设备指纹、行为分析)11. 无重复字符的最长子串(滑动窗口)12. 岛屿数量(DFS/BFS)