面经收集

1.RF和GBDT,XGBOOST的区别?
(1)GBDT与随机森林(Random Forest,RF)的区别与联系?

相同点:都是由多棵树组成,最终的结果都是由多棵树一起决定。

不同点:1)集成的方式:随机森林属于Bagging思想,而GBDT是Boosting思想。2)偏差-方差权衡:RF不断的降低模型的方差,而GBDT不断的降低模型的偏差。3)训练样本方式:RF每次迭代的样本是从全部训练集中有放回抽样形成的,而GBDT每次使用全部样本。4)并行性:RF的树可以并行生成,而GBDT只能顺序生成(需要等上一棵树完全生成)。5)最终结果:RF最终是多棵树进行多数表决(回归问题是取平均),而GBDT是加权融合。6)数据敏感性:RF对异常值不敏感,而GBDT对异常值比较敏感。7)泛化能力:RF不易过拟合,而GBDT容易过拟合。

(2)xgboost与传统GBDT的区别与联系

1) GBDT是机器学习算法,xgboost是该算法的工程实现;2) xgboost在代价函数里加入了正则项,用于控制模型的复杂度,有利于防止过拟合,从而提高模型的泛化能力;3) 传统GBDT在优化时只用到一阶导数信息,xgboost则对代价函数进行了二阶泰勒展开,同时用到了一阶和二阶导数,而且xgboost工具支持自定义代价函数,(损失函数变为二阶,可以求最小值,换形式写一下后会发现二阶导数是loss的权重)只要函数可一阶和二阶求导;4) 传统GBDT以CART作为基分类器,xgboost还支持多种类型的基分类器,比如线性分类器;5) xgboost借鉴了随机森林的做法,支持对数据进行采样,不仅能降低过拟合,还能减少计算;6) 传统的GBDT没有设计对缺失值进行处理,xgboost能够自动学习出缺失值的处理策略
2.crf损失函数?过拟合怎么解决?正则化项有哪些,作用分别是什么?
笔记里有,过拟合有几个解决办法
1)数据增强;2)减少特征;3)L1,L2正则化;4)Dropout;5)early stopping;6)控制模型复杂度,别太复杂
3.模型优化方法(梯度下降?还有呢?不知道)?
牛顿法、拟牛顿法
4.l1正则化和l2正则化分别加了什么先验条件?(拉普拉斯分布和正态分布),L1和L2适用于什么场景,具体怎样实现的呢?
5.SVM损失函数怎样求解的呢,可以用梯度下降法求解吗?
6.梯度下降法求解适合用于什么场景?
7.过拟合的欠拟合介绍,怎样解决过拟合?
最后是一道概率+算法问题:给N个绳子,每次取两个端点打结在一起,求最终绳子打结的期望(先用数学公式描述,再用代码描述)
最后就是一个编程题:旋转矩阵二分查找(要求时间复杂度是log(n))
算法题:给两个字符串,可以对其中一个字符串进行增删移动添加操作求将其中一个字符串转变成另一个字符串的最小操作步骤

怎么理解self attention中的Q, K, V

写一个装饰器,解释一下python的装饰器

全部评论

相关推荐

02-25 09:55
已编辑
门头沟学院 Java
2.4 一面2.6 二面2.9 三面(hr面)2.13 oc1.15号收到面试电话那会就开始准备,因为一开始没底所以选择推迟一段时间面试,之后开始准备八股,准备实习可能会问的东西,这期间hot100过了有六七遍,真的是做吐了快,八股也是背了忘,忘了背,面经也看了很多,虽然最后用上的只有几道题,可是谁知道会问什么呢自从大二上开始学java以来,一开始做外卖,点评,学微服务,大二下五六月时,开始投简历,哎,投了一千份了无音讯,开始怀疑自己(虽然能力确实很一般),后来去到一家小小厂,但是并不能学到什么东西,而且很多东西都很不规范,没待多久便离开,大二暑假基本上摆烂很怀疑自己,大三上因为某些原因开始继续学,期间也受到一俩个中小厂的offer,不过学校不知道为啥又不允许中小厂实习只允许大厂加上待遇不太好所以也没去,感觉自己后端能力很一般,于是便打算转战测开,学习了一些比较简单的测试理论(没有很深入的学),然后十二月又开始继续投,java和测开都投,不过好像并没有几个面试,有点打击不过并没有放弃心里还是想争一口气,一月初因为学校事比较多加上考试便有几天没有继续投,10号放假后便继续,想着放假应该很多人辞职可能机会大一点,直到接到字节的面试,心里挺激动的,总算有大厂面试了,虽然很开心,但同时压力也很大,心里真的很想很想很想进,一面前几天晚上都睡不好觉,基本上都是二三点睡六七点醒了,一面三十几分钟结束,问的都不太难,而且面试官人挺好但是有些问题问的很刁钻问到了测试的一些思想并不是理论,我不太了解这方面,但是也会给我讲一讲他的理解,但是面完很伤心觉得自己要挂了。但是幸运的是一面过了(感谢面试官),两天后二面,问的同样不算难,手撕也比较简单,但也有一两个没答出来,面试官人很好并没有追问,因为是周五进行的二面,没有立即出结果,等到周一才通知到过了,很煎熬的两天,根本睡不好,好在下周一终于通知二面过了(感谢面试官),然后约第二天三面,听别的字节同学说hr面基本上是谈薪资了,但是我的并不是,hr还问了业务相关的问题,不过问的比较浅,hr还问我好像比较紧张,而且hr明确说了还要比较一下,我说我有几家的面试都拒了就在等字节的面试,三面完后就开始等结果,这几天干啥都没什么劲,等的好煎熬,终于13号下午接到了电话通知oc了,正式邮件也同时发了,接到以后真的不敢信,很激动但更重要的是可以松一口气了,可以安心的休息一下了终于可以带着个好消息过年了,找实习也可以稍微告一段落了,虽然本人很菜,但是感谢字节收留,成为忠诚的节孝子了因为问的比较简单,面经就挑几个记得的写一下一面:1.实习项目的难点说一下2.实习中用到了哪些测试方法3.针对抖音评论设计一下测试用例4.手撕:合并两个有序数组二面:1.为什么转测开2.线程进程区别,什么场景适合用哪个3.发送一个朋友圈,从发出到别人看到,从数据流转的角度说一下会经历哪些过程4.针对抖音刷到广告视频设计测试用例5.手撕:无重复字符的最长字串
厂办龚彪:锲而不舍 金石可镂
查看8道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务