哔哩哔哩大数据面经

已意向书
一面:50min
1.自我介绍
2.做题
(1)链表找倒数第K个节点,注意各种异常情况,记得是剑指offer原题吧,快慢指针做就可以了。
(2)反转字符串内的单词,LeetCode原题,不能用字符串的reverse函数和split函数,比较简单,手写一个split函数就是了。
(3)TopK,比较常规,好几种做法,注意讲清楚时间复杂度
(4)  100亿数据排序,我想到的就是多路归并外排,不知道有更好的思路没
3.虚拟内存详细讲讲
4.进程调度算法
5.进程间通信方式
6.TCP三次握手
7.你的项目中用到了Kafka,讲一下你的日志数据发送到Kafka依次经历了什么
我在这里就是讲了依次经过的五层模型,然后面试官问了下网络层和传输层的一些东西,然后问了个在这个过程有什么加密算法吗,这个我就不知道
8.Hbase和Hive讲讲?Hbase底层实现原理?
10.你说你熟悉Linux,那我问你在终端上输入 "ls" 在Linux中依次经历了什么?
11.你在北京上学啊,那你怎么想要来上海,你要来上海吗?
不去
#哔哩哔哩##面经##校招##大数据开发工程师#
全部评论
补充下二面,就是聊天,问base怎么选择的什么的,你的优缺点什么的
1 回复
分享
发布于 2020-08-24 12:25
请教下 hbase 底层实现原理是讲 LSM 树这一块么
1 回复
分享
发布于 2020-09-06 15:11
联易融
校招火热招聘中
官网直投
楼主你好,请问你是实习、校招还是社招?
点赞 回复
分享
发布于 2020-08-17 14:55
几面啊楼主~
点赞 回复
分享
发布于 2020-09-12 14:16

相关推荐

 适合小白或者其他领域转Flink或者轻度使用者查看,大佬轻轻喷基础篇1. 什么是Apache Flink?​Apache Flink是一个开源的流处理和批处理框架,可以实现快速、可靠、可扩展的大数据处理。​2. Flink与Hadoop的区别是什么?​Flink是一个全面的流处理和批处理框架,提供了低延迟和高吞吐量的实时数据处理能力,而Hadoop更侧重于离线批处理。​3. Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?​事件时间是数据实际生成的时间,而处理时间是数据到达Flink系统的时间。事件时间可以通过时间戳标记数据,而处理时间是Flink根据数据到达的顺序生成的。​4. Flink的容错机制是如何实现的?​Flink使用检查点(Checkpoint)机制实现容错。它会定期保存应用程序的状态,并在发生故障时恢复到最近的一个检查点状态。​5. 什么是Flink的窗口(Window)?窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块,并对每个窗口进行计算。6. Flink支持哪些类型的窗口?​Flink支持滚动窗口(Tumbling Window)、滑动窗口(Sliding Window)和会话窗口(Session Window)。7. Flink中的状态后端(State Backend)是什么?​状态后端是Flink用于保存和管理应用程序状态的机制。它可以存储状态到内存、文件系统或分布式存储系统(如HDFS)中。8. Flink的水印(Watermark)是什么?​水印是用于表示事件时间进度的标记。它通常与数据流中的时间戳一起使用,用于处理乱序事件和延迟数据。9. Flink的时间窗口触发器(Trigger)是什么?​时间窗口触发器用于控制何时触发计算窗口的输出。它可以基于元素数量、处理时间、水印等条件进行触发。​... 完整版见:原文链接:https://blog.csdn.net/qq_30757161/article/details/137459710#数据开发##金三银四,你有感觉到吗##大数据#
点赞 评论 收藏
转发
5 46 评论
分享
牛客网
牛客企业服务