信也科技——数据挖掘面经

2020.9.15投递
2020.9.18笔试  七道主观题  3or4概率统计题目、1道编程填空题目、1道风控模型分析题目、1道机器学习题目
————————————————————————————————————————————
2020.9.25 一面有些记不太清除了
自我介绍

挖实习经历:风控相关:解释一些WOE值是怎么计算的,IV值是怎么计算的

还有就是一些风控建模细节

大数定律

线性回归的拟合优度$R^2$是怎么计算的

解释一下P值的概念

对信也了解吗?以前的拍拍贷

如果客户一直对你的模型不满意怎么办

解释一下过拟合(有好多家笔试都考到了的)

撸了一道sql题 两表连接+筛选条件 比较简单

整体体验蛮好的

反问:平时的主要业务和工作是什么?
————————————————————————————————————
2020.9.30 二面

没有自我介绍,面试官上来就吐槽我的简历太简洁(要不是一面的面试官问了很多问题都不知道我做了这么多工作),尴尬。。。  投递的有些匆忙,用的是最开始的简历

挖实习经历

中心极限定理(我忘记了,说我对大数定律比较了解,然后讲了大数定律)
**大数定律、中心极限定理真的很重要,研究生复试问到了,找工作也还是逃不掉啊**

树模型、gbdt的实现过程  不要原理,要实现过程  我讲了一堆boosting的原理,还有gbdt和adaboost的区别与联系  但是面试官还是说我说的是原理  引导问:决策树是怎么生成的,我就简单讲了下基于信息熵、信息增益、基尼指数、平方损失等,选择分裂节点,然后对于子树进行递归操作

xgboost是怎么分裂的?  没答上来

boosting和bagging的差异? 信手拈来

lightgbm和xgb的区别?xgboost是预排序  lightgbm是基于直方图,无论存储还是计算都要快很多

xgb,lightgbm的调参? 贪心算法,优先调重要的,然后调次要的

怎么降低过拟合 调整顺序  优先调什么?

建模时xgboost的损失函数是什么样的?(没答上来,忘记了。。。应该是回答auc吧)  追问了解mae和mse吗? 解释一下两者的差异?

面试官看我用过catboost,让我讲一下(我只是用过,没有太深入的进行了解,就讲了一下处理类别变量的优势)

评分卡模型了解吗?讲一下步骤

评分卡模型得到的分数在某一个分数段上比较集中该怎么处理?

有多少家公司正在面?

你有想去的地方吗?你的计划是留在一线城市嘛?

反问:数据挖掘岗平时的主要工作是干什么呢?(好像问了和一面一模一样的反问,不过两个面试官给出的角度还是不太一样的,不过确实是我想做的风控建模的工作)

国庆后给通知么?(是的) 本来复试想推倒国庆后,国庆好好准备一下的,不过hr说,复试的流程要在国庆前结束。

二面的整体感觉也是很棒的,感觉面试官问的很技术,问到了各种算法的细节。我也还需要继续努力学习其中的细节。

————————————————————————————

希望可以帮助一些想要从事风控的同学们

————————————————————————————

2020.10.15 已oc  感谢帮助过我的小伙伴们
#面经##校招##数据挖掘#
全部评论
Lz后续有消息吗?
3 回复
分享
发布于 2020-10-13 01:15
请问像风控模型分析和机器学习的题目都是什么形式?选择,简答题?
点赞 回复
分享
发布于 2020-10-12 22:27
滴滴
校招火热招聘中
官网直投
请问二面过后还有hr面吗
点赞 回复
分享
发布于 2021-10-21 19:59

相关推荐

3月30号考的gsat。和网上说的一样,题难而且题量大,真的做下来很绝望。关键是这玩意儿没有学习材料,想提前练都没得练。做几个公务员行测题的确有一定帮助,但是真的上手就知道了,时间不够,平均一个题一分钟,很难。50个题,我有把握的就10来个。但是去考试的人不多,可能是春招了,有可能很多人都瞧不上三星。我那场可能也就20个人不到吧,有几个还迟到。下来我就觉得没戏,直接找hr发疯。hr说“大部分都能过”,我觉得是在安慰我。结果4天前告诉我过了。好家伙,我做成那样都能过,这不是跟不考一样😅所以如果有人去的话,我的建议就是不要怕,稳扎稳打,反正春招你就瞄准1个小时做10道题就行。但是这么水的gsat为后面更水的面试埋下了伏笔。软件工程师,微信视频面的,16分钟。主要包含2分钟自我介绍,简历项目提问,个人发展,薪资相关。是的,没了!这就是面试全流程!没了!薪资提问时更是惊到我了,我报的薪资也不算高,但是被说达不到,还是差的有点远,说我有没有了解过应届生薪资情况,可以了解一下,我们这是制造业不是互联网大厂。好的,这个纠缠了3、4分钟,就结束了。看了是要被挂了,要我是面试官我肯定不给过,因为薪资差太多人家肯定不会来,不如直接给挂。全程技术问题没有问,唯一稍微相关一点点就是我的一个项目,让我用通俗易懂的话介绍一下,我介绍完了人家说了解了,没了。🤐最后说一个我自己很搞笑的地方。我还申请了其他公司的面试,那个公司我很看重,但是要准备英文自我介绍。我还没开始准备,但是一直放在心头,结果就和三星这个搞混了,人家只要中文介绍就行结果我搁那巴拉巴拉半天英语。人家也没说什么,然后就说“你英文这么好怎么学习的呢?跟外国友人交谈怎么样?”,我还以为是客套话安慰,想着这人不错。下来仔细一看,人家根本没说要英文自我介绍🤪🤪我木住了,突然感觉面试官的夸赞有了几分挖苦的味道。我就感觉,面试官让我开始的时候我说了句“首先是我的英文自我介绍”的时候有人哼笑了一声。尬死我了。但是整体氛围不压抑。hr和三位面试官,还行,甚至感觉有点随便。白瞎我按职位要求准备那么多sql、数据结构、算法、机器学习的内容呢,还费尽心思准备英文。毁灭吧,希望接下来的路好一些。
点赞 评论 收藏
转发
头像
04-08 11:38
已编辑
门头沟学院 计算机类
快手二面:1. jdk1.8之后jvm的内存模型?1.8之后还有方法区吗?讲讲永久代、元空间是怎么回事?2. 讲一下垃圾回收器?比较一下cms和g1以及各自的适用场景3. 什么是oom?内存满了,怎么排查是代码哪里有问题?(我说pstack,他说不是栈满了,我说不会,没用过,面试官说没事可能有点偏有点偏业务应用)4. 线程池有没有用过?核心线程和非核心线程区别是什么?核心线程数设置的考量因素有哪些?没有任务的时候核心线程和非核心线程是继续存在还是销毁?jdk有没有提供销毁核心线程节约资源的方法?我如果想要动态核心线程数而不需要重启服务怎么实现?(想了很久不知道。。)5. 来个计网八股意思一下,讲一下tcp和udp的区别?慢启动是什么?6. mysql的索引数据结构是什么?聚簇索引和非聚簇索引的区别?数据库有哪些锁?select * from user where userid=5 for update是什么锁?假如usreid是索引但是没有这个数据,锁的是什么?没有索引也没有5这个数据,锁的是什么?7. 项目分布式锁为什么用redis不用别的?(一下不记得区别了,我说因为和java有redission集成,功能丰富并且使用方便。。)讲一下redis的集群结构?你们用的是什么?我说一主多从,他说流量大的时候扛不住,没有用分片吗?我说我知道分片slot,那个确实可以,不过我们数据量不大就没用。。跨服务的时候怎么保证多个数据库的数据一致性?然后还有针对项目业务场景的一些分布式问题。8. 手撕:合并K个有序链表。我说顺序合并,面试官问时间复杂度是多少?能不能优化?优化后是多少?9. 反问环节聊了15分钟,说快手80%流量都是他们组的,快手上下滑刷到的视频以及点赞评论收藏那些功能都是他们组,来这里之后做好卷的准备。我问对我有什么评价或者建议吗,面试官说虽然有些应用层次的深度还不够,不过其实还不错,应该问题不大,后续还有个老板的技术面,加油攒人品,求个三面4.8还愿:约三面了 #春招#
点赞 评论 收藏
转发
13 87 评论
分享
牛客网
牛客企业服务