4.24百度三面#T联合#搜索推荐
------大抵是凉了的----------
-------------------------------------------------------------
------------------------------------------------------------
一面(45min)
- 上来简单介绍一下自己的项目,根据项目提问一些比较基础的问题,数据集大小,数据处理等(15min)
- 手撕第k大的数字,要求先回答场景问题,亿级别的数字,k比较小(pass了快选),手写堆排序,我写了个小根堆让过了,
- 基础知识:问了集成学习的各种boosting bagging stacking异同,问了xgb相对gbdt改进,树模型的输入特征。给个场景让讲述一下二分类任务的流程(从数据处理,到模型的设计,稀疏值怎么办,不均匀怎么办)如果用lr的话如何确定二分类阈值,用什么指标? 说说知道那些优化器? 了解nlp吗
- 无反问
苦等了十多分钟二面来了
二面(55min)
- 上来介绍项目,提问很多细节,会提问动机啥的
- 零钱兑换& 最长的重复节点(值)的路径(类似最大路径和,但是要求找的是节点相同的路径长度)--写了思路简单手写了个样例
- 问深度学习知道那些模型,讲讲,深度学习模型对比机器学习模型的好坏。竞赛的数据处理,为什么不尝试更复杂的网络?xgb用了那些特征?那些特征重要你试了吗?如何评价因果推理的方式引用到推荐除偏任务上的优缺点,和其他工作相比,因果有那些好处,缺点呢?讲讲其他除偏任务怎么做?因果的方法针对大规模数据的场景适用性如何?说一下知道那些embedding的方式?你如何对用户交互进行embedding的? 如何更新参数?
- 反问流程&后续的岗位分配
三面(35min)
- 上来共享简历,介绍了第一个项目,然后提问
- 给个场景,百度的搜索网页(很大亿级)让你构思如何从特征处理到训练模型找到其中***类的网页
- 排列组合:开20枪 中4枪 其中3枪连续中 问一种有多少种方法
- 二叉树,从叶子结点开始点燃这个二叉树,每个结点燃烧耗时1个单位,并且燃烧可以蔓延,问最短的燃烧时间是多少?先讲思路再coding,讲了几个思路都被否定了(期间多次提示,奈何太菜不会-。-最后面试官大佬给了点面子让写个求二叉树深度
- 谈谈深度学习机器学习的应用场景,不同场景下怎么选择?你在学校期间遇到最困难的问题?你怎么解决的
- 无反问
------------------------------------------------------------