小米大数据开发一面凉经

1、自我介绍

2、谈一谈你对HBase的理解。

3HBase中如果遇到同样多的列数,多列族少列限定符,和少列族多列限定符,如何设计和选择?

4HBaserowkey的设计?

5HBaseGetScan的区别和联系?

6、谈一谈什么是RDD及你对RDD的理解。

7、宽依赖算子举例?

8MapReduceShuffleSparkShuffle异同?谈一谈各自的特点和过程。

9、了解流处理么?

10SparkSQL你们文件读取的是什么格式?

11Hive中遇到数据倾斜如何解决?(hive.groupby.skewindata了解么、mapjoin如何实现?)Spark遇到数据倾斜如何解决?

12Hive中如何调整MapperReducer的数目?

13groupbyKeycountByKey(统计)造成的数据倾斜和join造成的数据倾斜,分别应该如何解决?

14reduceByKeygroupByKey有什么区别,Spark在底层对reduceByKey做了哪些优化?

15hive分区和分桶有何异同?

16hive窗口函数熟悉么?举一些用过的例子?

17、二叉树了解么?说明一下完全二叉树和满二叉树的区别?

18、如何求一个二叉树的高度?简要说明方法。(答递归),非递归呢?

19LinkedListArrayList的区别和联系?

20Spark yarn日志看过没有?GC时间过长如何优化代码?

21、你有什么要问我的么?然后让我注重一下基础。

#小米##面经##大数据开发工程师##校招#
全部评论
tql
1 回复
分享
发布于 2019-09-10 13:00
膜***
点赞 回复
分享
发布于 2019-09-09 17:36
联想
校招火热招聘中
官网直投
谢谢你的分享,请问没有问项目相关的嘛?我看都是基础知识
点赞 回复
分享
发布于 2019-09-09 18:08
我也是这个岗位。我感觉问我的都很简单。😂
点赞 回复
分享
发布于 2019-09-09 18:59
哭泣、大佬带带我
点赞 回复
分享
发布于 2019-09-18 20:51
emm  第三个该怎么答啊?。。。。
点赞 回复
分享
发布于 2019-09-19 17:44

相关推荐

 适合小白或者其他领域转Flink或者轻度使用者查看,大佬轻轻喷基础篇1. 什么是Apache Flink?​Apache Flink是一个开源的流处理和批处理框架,可以实现快速、可靠、可扩展的大数据处理。​2. Flink与Hadoop的区别是什么?​Flink是一个全面的流处理和批处理框架,提供了低延迟和高吞吐量的实时数据处理能力,而Hadoop更侧重于离线批处理。​3. Flink中的事件时间(Event Time)和处理时间(Processing Time)有什么区别?​事件时间是数据实际生成的时间,而处理时间是数据到达Flink系统的时间。事件时间可以通过时间戳标记数据,而处理时间是Flink根据数据到达的顺序生成的。​4. Flink的容错机制是如何实现的?​Flink使用检查点(Checkpoint)机制实现容错。它会定期保存应用程序的状态,并在发生故障时恢复到最近的一个检查点状态。​5. 什么是Flink的窗口(Window)?窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块,并对每个窗口进行计算。6. Flink支持哪些类型的窗口?​Flink支持滚动窗口(Tumbling Window)、滑动窗口(Sliding Window)和会话窗口(Session Window)。7. Flink中的状态后端(State Backend)是什么?​状态后端是Flink用于保存和管理应用程序状态的机制。它可以存储状态到内存、文件系统或分布式存储系统(如HDFS)中。8. Flink的水印(Watermark)是什么?​水印是用于表示事件时间进度的标记。它通常与数据流中的时间戳一起使用,用于处理乱序事件和延迟数据。9. Flink的时间窗口触发器(Trigger)是什么?​时间窗口触发器用于控制何时触发计算窗口的输出。它可以基于元素数量、处理时间、水印等条件进行触发。​... 完整版见:原文链接:https://blog.csdn.net/qq_30757161/article/details/137459710#数据开发##金三银四,你有感觉到吗##大数据#
点赞 评论 收藏
转发
6 64 评论
分享
牛客网
牛客企业服务