你我贷 风控 校招面经

你我贷 风控

前两轮的面试都是以电话沟通的方式进行的。整个面试过程非常愉快,第一轮的面试官是数据主管,让我详细聊了一下过往比较成功的1-2个项目细节,并针对遇到的问题进行了比较细致的提问和讨论;


第二轮的面试官是部门总监,看得出是技术出生,对于很多问题,都看得非常透彻,同样也是针对过往的经历,甚至在校的论文、项目经历进行交流和探讨;

终面是当面沟通,比较偏向于开放式讨论,抛出问题,讨论如何解决;

HR面也进行的比较愉快,很耐心的给我讲解整个公司的架构,未来发展的方向。

过拟合原因 数据:数据不规范,数据量少,数据穿越,统计特征用到了未来的信息或者标签信息 算法:算法过于复杂 解决: 1、将数据规范化,处理缺失值,增加数据量,采样,添加噪声数据 2、正则化,控制模型复杂程度, 3early stoping,减少迭代次数,减少树的深度, 4、学习率调大/小点、 5、融合几个模型

L1L2的区别

1L1Lasso Regression,表示向量中每个元素绝对值的和:L1范数的解通常是稀疏性的,倾向于选择数目较少的一些非常大的值或者数目较多的insignificant的小值。

2L2是岭回归,Ridge Regression,是欧氏距离也就是平方和的平方根。L2范数越小,可以使得w的每个元素都很小,接近于0,但L1范数不同的是他不会让它等于0而是接近于0

3L1正则化的w可取的值是转置的方形,L2对应的是圆形。这样损失函数lw)的最小值更容易在L1对应的边角上取得,从而这些维度变成0了。 从贝叶斯的角度来看,加入正则项相当于加入了一种先验。即当训练一个模型时,仅依靠当前的训练数据集是不够的,为了实现更好的泛化能力,往往需要加入先验项。 L1范数相当于加入了一个Laplacean先验; L2范数相当于加入了一个Gaussian先验。

4L2对大数的惩罚更大,但是解相对来说比较均匀。

#面经##校招##风控##你我贷#
全部评论

相关推荐

4 4 评论
分享
牛客网
牛客企业服务