bg:双一流本,两年工作经验,给还在学习的朋友们分享一些对应经验下企业所问的问题,也有助于自己未来进行总结。以下打⭐为印象深刻的问题。Q:技术面:(1)自我介绍(背景+工作经验+工作内容+成果)(2)项目拷打①推荐算法:(3)注意力Q,K,V计算公式(4)self-attention和external-attention的区别(5)了解过哪些主流的推荐算法(6)讲一下Wide&Deep原理(7)推荐算法中正负样本集是如何构建的(8)如何理解auc指标(9)平时用哪些框架(pytorch),如果接触到tensorflow项目,最快需要多长时间能上手②机器学习算法:(10)了解什么是特征偏移么(11)对于数据不平衡问题的解决办法(12)训练集和测试集的正负样本比相差过大怎么办(如训练集1:49,测试集1:199)(13)知道什么是概率校准么(14)讲述一下二分类的原理⭐(15)平时有了解过LLM么(16)做过xgboost的超参数优化么,以及对早停机制(early stopping)有没有什么深刻理解⭐(17)平时做过哪些衍生特征(18)如何筛选重要特征(19)如何避免特征之间的多重共线性,避免了又会有什么缺点(20)以业务的角度筛选特征有什么缺点⭐(21)xgboost是如何处理缺失值的(22)对类别变量有什么处理方法(23)机器学习和深度学习分别建模有哪些不同点(24)xgboost的多分类和神经网络中的多任务有什么区别