张天元

2019-09-09 18:30 已编辑 Java

关注

小米大数据开发一面凉经

1、自我介绍

2、谈一谈你对HBase的理解。

3、HBase中如果遇到同样多的列数，多列族少列限定符，和少列族多列限定符，如何设计和选择？

4、HBase中rowkey的设计？

5、HBase的Get和Scan的区别和联系？

6、谈一谈什么是RDD及你对RDD的理解。

7、宽依赖算子举例？

8、MapReduce的Shuffle和Spark的Shuffle异同？谈一谈各自的特点和过程。

9、了解流处理么？

10、SparkSQL你们文件读取的是什么格式？

11、Hive中遇到数据倾斜如何解决？（hive.groupby.skewindata了解么、mapjoin如何实现？）Spark遇到数据倾斜如何解决？

12、Hive中如何调整Mapper和Reducer的数目？

13、groupbyKey、countByKey（统计）造成的数据倾斜和join造成的数据倾斜，分别应该如何解决？

14、reduceByKey和groupByKey有什么区别，Spark在底层对reduceByKey做了哪些优化？

15、hive分区和分桶有何异同？

16、hive窗口函数熟悉么？举一些用过的例子？

17、二叉树了解么？说明一下完全二叉树和满二叉树的区别？

18、如何求一个二叉树的高度？简要说明方法。（答递归），非递归呢？

19、LinkedList和ArrayList的区别和联系？

20、Spark yarn日志看过没有？GC时间过长如何优化代码？

21、你有什么要问我的么？然后让我注重一下基础。

#小米##面经##大数据开发工程师##校招#

全部评论

推荐最新楼层

刘shu君

上海财经大学

tql

1 回复

发布于 2019-09-10 13:00

💐以诺

Java

膜***

点赞回复

发布于 2019-09-09 17:36

联想

校招火热招聘中

官网直投

滋滋201903072049426

算法工程师

谢谢你的分享，请问没有问项目相关的嘛？我看都是基础知识

点赞回复

发布于 2019-09-09 18:08

继续冲啊

大数据开发工程师

我也是这个岗位。我感觉问我的都很简单。😂

点赞回复

发布于 2019-09-09 18:59

即将北漂的小萌新

大数据开发工程师

哭泣、大佬带带我

点赞回复

发布于 2019-09-18 20:51

从此我叫王超越

Java

emm 第三个该怎么答啊？。。。。

点赞回复

发布于 2019-09-19 17:44

药不起

04-09 14:15

已编辑

拼多多_Java研发工程师

拼多多校招内推

【2024届校园招聘】内推链接：https://careers.pinduoduo.com/campus/grad?t=6Hiratgc5c，内推码：6Hiratgc5c。期待你的加入！我们一起，无拼不青春！（通过此链接投递计入内推，内推简历优先筛选~）引流：字节跳动，海康威视，深信服，腾讯，阿里巴巴，拼多多，滴滴，京东，小米，大疆，美团，好未来，小红书，华为，简历，offer，面试，面经，三方，国企，央企，秋招，应届生，求职，比亚迪，建设银行，工商银行，百度，中兴，邮储、中行、建行、工行、建行、光大、招商银行、科大讯飞、蔚来、新华三、京东方、容知日新、长鑫存储、阳光电源、中国移动、中国电信、...

投递拼多多等公司10个岗位 >

点赞评论收藏

加油吧少年!

04-07 15:29

阿里巴巴集团_阿里集团-CTO线_软件开发工程师岗

Flink常见面试问题(附答案)

 适合小白或者其他领域转Flink或者轻度使用者查看，大佬轻轻喷基础篇1. 什么是Apache Flink？Apache Flink是一个开源的流处理和批处理框架，可以实现快速、可靠、可扩展的大数据处理。2. Flink与Hadoop的区别是什么？Flink是一个全面的流处理和批处理框架，提供了低延迟和高吞吐量的实时数据处理能力，而Hadoop更侧重于离线批处理。3. Flink中的事件时间（Event Time）和处理时间（Processing Time）有什么区别？事件时间是数据实际生成的时间，而处理时间是数据到达Flink系统的时间。事件时间可以通过时间戳标记数据，而处理时间是Flink根据数据到达的顺序生成的。4. Flink的容错机制是如何实现的？Flink使用检查点（Checkpoint）机制实现容错。它会定期保存应用程序的状态，并在发生故障时恢复到最近的一个检查点状态。5. 什么是Flink的窗口（Window）？窗口是Flink中用于对无限数据流进行有界处理的机制。它将无限流切分为有限的、不重叠的块，并对每个窗口进行计算。6. Flink支持哪些类型的窗口？Flink支持滚动窗口（Tumbling Window）、滑动窗口（Sliding Window）和会话窗口（Session Window）。7. Flink中的状态后端（State Backend）是什么？状态后端是Flink用于保存和管理应用程序状态的机制。它可以存储状态到内存、文件系统或分布式存储系统（如HDFS）中。8. Flink的水印（Watermark）是什么？水印是用于表示事件时间进度的标记。它通常与数据流中的时间戳一起使用，用于处理乱序事件和延迟数据。9. Flink的时间窗口触发器（Trigger）是什么？时间窗口触发器用于控制何时触发计算窗口的输出。它可以基于元素数量、处理时间、水印等条件进行触发。... 完整版见：原文链接：https://blog.csdn.net/qq_30757161/article/details/137459710#数据开发##金三银四，你有感觉到吗##大数据#

点赞评论收藏

03-27 21:13

两周多前投递了百度春招补录，一周多前显示笔试，到现在也没有发笔试链接。。是什么情况。。😅

投递百度等公司8个岗位 >

点赞评论收藏

半斤瞎扯淡

03-28 18:47

点赞评论收藏

04-12 19:07

4.9一面 4.11二面 4.12三面已约hr面，想请问hr面会筛人吗，然后boss直聘这家公司工作强度怎么样啊

点赞评论收藏

6 64 评论

招聘动态

联易融2024届营销管培生校园招聘

联想

24届应届+25届实习

小红书

24届春招&25届实习生招聘

24届春招硬件高薪职位集合

全站热榜

正在热议