微软暑期实习二面
一面题目
有序数组,查找小于等于某个数的最大值,边界问题考了很多次
二面
LN 和BN的差别 transformer为什么使用LN
GBDT原理
GBDT是分类树还是回归树
节点是怎样分裂的
MSE的公式
GBDT怎样做正则
GBDT缩减系数是什么,怎么做的
GBDT学习率是什么
题目:
先序遍历二叉搜索树存在一个数组中,还原它
想问下各位老哥,均方差和MSE是一个东西吗,自己晕了
transfomer本质上也可以用BN,为啥不用BN用LN,感觉自己没回答好
#微软暑期实习春招##微软##面试题目#