百度补招数据挖掘工程师三面面经

今年的最后一场面试,百度补招,面了整整一下午,分享一波。


一面 64min


1.自我介绍。

2.奈奎斯特采样定律?(开场问题,有点不按套路)

3.项目,一堆延伸问题。

4.比赛,一堆延伸问题

5.缺失值填充的方法?

6.算法题1:找众数。(还问了时间复杂度和空间复杂度,优化了一波然后)

7.智力题:有1000个棋子,每个人一次能拿到1-7个,现在你先下,我后下,问如何才能保证你最后一定赢?(让五分钟答出来,lz智商感人了,没答出来,反正就简单说了下思路😂)

8.算法题2:平衡二叉树判断(好久没刷题,说了下思路😭,菜是原罪)

9.算法题3:求x的n次幂。


二面 44min


1.问项目。

2.问比赛。

3.xgb的原理?

4.关联规则的方法?

5.机器学习的方法了解较深的是啥?

6.svm的原理?

7.聚类的方法有哪些?

8.决策树如何避免过拟合?


三面 40min


面试官比较凶这一轮。

1.自我介绍。(我按之前讲得溜溜的自我介绍说,他说不要讲简历上有的,你现在就说说你想做什么,优势是啥?)

2.最拿手的算法讲下?

3.喜欢做算法创新还是工程化的东西?

4.有什么做算法创新的例子证明下?

5.用过的数据集多大?(我忘记了😂,就说记不太清楚了,大概几g?面完查了下,应该是几十g-几百g,满脸黑线)

6.掌握哪些工具?

7.word2vec的原理?如果让你对它进行改进,怎么改?

8.向面试官提问环节


最后说让回去等消息,有消息会通知😂,结束。

#百度#
全部评论
什么部门,老哥
点赞 回复
分享
发布于 2020-01-02 10:12
面的哪个部门
点赞 回复
分享
发布于 2020-01-02 15:27
联易融
校招火热招聘中
官网直投
7.word2vec的原理?如果让你对它进行改进,怎么改? 这个老哥你有答案了吗?改进这个😅
点赞 回复
分享
发布于 2020-02-05 10:59

相关推荐

 适合小白或者其他领域转Flink或者轻度使用者查看,大佬轻轻喷基础篇1. 什么是Apache Flink?​Apache Flink是一个开源的流处理和批处理框架,可以实现快速、可靠、可扩展的大数据处理。​2. Flink与Hadoop的区别是什么?​Flink是一个全面的流处理和批处理框架,提供了低延迟和高吞吐量的实时数据处理能力,而Hadoop更侧重于离线批处理。​3. Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?​事件时间是数据实际生成的时间,而处理时间是数据到达Flink系统的时间。事件时间可以通过时间戳标记数据,而处理时间是Flink根据数据到达的顺序生成的。​4. Flink的容错机制是如何实现的?​Flink使用检查点(Checkpoint)机制实现容错。它会定期保存应用程序的状态,并在发生故障时恢复到最近的一个检查点状态。​5. 什么是Flink的窗口(Window)?窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块,并对每个窗口进行计算。6. Flink支持哪些类型的窗口?​Flink支持滚动窗口(Tumbling Window)、滑动窗口(Sliding Window)和会话窗口(Session Window)。7. Flink中的状态后端(State Backend)是什么?​状态后端是Flink用于保存和管理应用程序状态的机制。它可以存储状态到内存、文件系统或分布式存储系统(如HDFS)中。8. Flink的水印(Watermark)是什么?​水印是用于表示事件时间进度的标记。它通常与数据流中的时间戳一起使用,用于处理乱序事件和延迟数据。9. Flink的时间窗口触发器(Trigger)是什么?​时间窗口触发器用于控制何时触发计算窗口的输出。它可以基于元素数量、处理时间、水印等条件进行触发。​... 完整版见:原文链接:https://blog.csdn.net/qq_30757161/article/details/137459710#数据开发##金三银四,你有感觉到吗##大数据#
点赞 评论 收藏
转发
1 24 评论
分享
牛客网
牛客企业服务