项目主要用到了gbdt和LR,主要问的这两个模型 GBDT每轮拟合的是什么东西,GBDT做分类问题时又拟合的是什么东西(当时懵了,拟合的是梯度嘛?) 缺失值具体怎么做的,怎么考虑 LR+L1作用 GBDT除了平方损失,还有什么损失函数 GBDT里的G代表什么,体现在哪里,XGboost在梯度上改进的地方 OneHot的作用:将特征映射到欧氏空间,更合理的计算距离或者相似度度量,表达上更合理 决策树不适合用onehot的原因:结点分裂时容易分散?不清楚 遇到一个具体问题时,选择什么模型,有哪些方面的考虑、依据 算法题:全排列、二分查找 在回忆面试...