【快手】快手大数据开发工程师面经

好像是流媒体的部门,一个下午面了三面技术,感觉还行,大概分享一下还记得的一些题吧。

一面(40min)

自我介绍
Spark任务调度(源码)
Kafka基本原理说一下(生产消费模型,存储,Leader选举,ISR,反正想到啥就说啥了)
Consumer Group中Consumer和Partition的对应关系(Range和RoundRobin)
Kafka支持什么语义(三种语义),怎么实现Exactly Once
Spark Streaming和Flink的区别(说部门主要用Flink,奈何我没怎么用过)
Scala的模式匹配和Java有什么区别
用Kafka的过程中有过什么问题,怎么解决
实习做了什么
撕代码:

  1. 有序链表合并
  2. n*m的带有数字的矩阵,从左上角走到右下角,问最短的路径上经过的数字的和是多少?(dp)

二面(1h20min)

自我介绍
Java多线程了解吗?写个生产者消费者模型吧(wtf?上来就搞这个)
写完讲了讲
线程池熟悉是吧?写个线程池(??还好我看过源码)
写完问怎么改进让它支持切换到SHUTDOWN状态?因为我只是参考了源码实现了一个能提交任务的简单线程池,没考虑别的,要改进的话有点麻烦,就大概说了下思路,也不知道对不对。
Java线程同步啥的,不太记得了。
Flink了解吗,基本的概念说一下
撕算法:给一个不带分隔符的IP字符串,要给出所有的可能的IP地址,返回一个List(懵逼,用回溯写了个大概)。
也没让我问问题就匆匆结束了

三面(40min)

自我介绍
实习做了什么
Kafka基本原理说一下,和其他的MQ相比的优势
Kafka 消费者怎么从Kafka取数据的
消费者怎么保证ExactlyOnce(感觉跟前两面的问题的有点重复)
Kafka消费者怎么保证有序性
Kafka生产者怎么保证不丢不重复(幂等)
Kafka生产者写入怎么保证有序
撕算法:两字符串最长公共子串(一开始是别的题,我没太搞懂他什么意思,就换这个了,反正dp做呗)

差不多就这样结束,三面面试官赶着开会,就匆匆结束了。

整体感觉还可以,就是撕的有点多,面得太累。二面感觉压力有点大,也可能是我复习的不是很到位,Java还是要多看看。




#快手校招##快手##大数据开发工程师##面经##校招#
全部评论
二面好难啊
点赞 回复
分享
发布于 2020-03-26 16:12
好难啊,大佬厉害
点赞 回复
分享
发布于 2020-03-27 09:04
阅文集团
校招火热招聘中
官网直投
感谢大佬面筋,今年秋招我应该用得上😁
点赞 回复
分享
发布于 2020-04-04 09:04
感谢南邮学长,最近面试每次问到kafka,我都说只会用,不懂原理,今天看完你的题目,我必须认真学一下原理了。
点赞 回复
分享
发布于 2020-04-04 10:47
问一下楼主啊,你最后入职了吗?
点赞 回复
分享
发布于 2020-05-19 18:09
算法都比较简单啊
点赞 回复
分享
发布于 2020-05-26 16:25
大佬 你的大数据怎么都是kafka  没有问hadoop 之类的吗
点赞 回复
分享
发布于 2020-08-27 09:28
许愿意向书!!!!
点赞 回复
分享
发布于 2020-08-27 10:11
大佬 你的大数据怎么都是kafka  没有问hadoop 之类的吗
点赞 回复
分享
发布于 2020-08-27 10:27
天哪  我一个不了解大数据生态的明天要面试了  好慌
点赞 回复
分享
发布于 2020-08-27 10:31

相关推荐

 适合小白或者其他领域转Flink或者轻度使用者查看,大佬轻轻喷基础篇1. 什么是Apache Flink?​Apache Flink是一个开源的流处理和批处理框架,可以实现快速、可靠、可扩展的大数据处理。​2. Flink与Hadoop的区别是什么?​Flink是一个全面的流处理和批处理框架,提供了低延迟和高吞吐量的实时数据处理能力,而Hadoop更侧重于离线批处理。​3. Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?​事件时间是数据实际生成的时间,而处理时间是数据到达Flink系统的时间。事件时间可以通过时间戳标记数据,而处理时间是Flink根据数据到达的顺序生成的。​4. Flink的容错机制是如何实现的?​Flink使用检查点(Checkpoint)机制实现容错。它会定期保存应用程序的状态,并在发生故障时恢复到最近的一个检查点状态。​5. 什么是Flink的窗口(Window)?窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块,并对每个窗口进行计算。6. Flink支持哪些类型的窗口?​Flink支持滚动窗口(Tumbling Window)、滑动窗口(Sliding Window)和会话窗口(Session Window)。7. Flink中的状态后端(State Backend)是什么?​状态后端是Flink用于保存和管理应用程序状态的机制。它可以存储状态到内存、文件系统或分布式存储系统(如HDFS)中。8. Flink的水印(Watermark)是什么?​水印是用于表示事件时间进度的标记。它通常与数据流中的时间戳一起使用,用于处理乱序事件和延迟数据。9. Flink的时间窗口触发器(Trigger)是什么?​时间窗口触发器用于控制何时触发计算窗口的输出。它可以基于元素数量、处理时间、水印等条件进行触发。​... 完整版见:原文链接:https://blog.csdn.net/qq_30757161/article/details/137459710#数据开发##金三银四,你有感觉到吗##大数据#
点赞 评论 收藏
转发
6 111 评论
分享
牛客网
牛客企业服务