三石大数据

2023-08-24 22:39 门头沟学院大数据开发工程师

关注

微众大数据开发高频面试题及答案【附JD分析】

推荐阅读文章列表：大数据开发面试笔记V4.0 || 面试聊数仓第一季 || 小白大数据学习路线

一、JD分析

根据业务方提供的需求，完成数仓建模开发【考察业务理解和SQL能力】

深入理解需求，建立核心指标，完成数据质量监控【考察业务理解和数据质量保障能力】

二、高频面试题总结

1. 如何进行数据质量监控

从四个原则来回答：【每个原则再结合实际来举例，吊打面试官，不懂的评论区讨论一下】

准确性
完整性
一致性
及时性

2. 讲一下项目中是如何分层的

先简单介绍五层架构：ods、dwd、dwm、dws、ads

然后介绍为什么这样分层，每一层干了什么

3. MapReduce的过程

map阶段：首先通过InputFormat把输入目录下的文件进行逻辑切片，默认大小等于block大小，并且每一个切片由一个maptask来处理，同时将切片中的数据解析成<key,value>的键值对，k表示偏移量，v表示一行内容；紧接着调用Mapper类中的map方法。将每一行内容进行处理，解析为<k,v>的键值对，在wordCount案例中，k表示单词，v表示数字1 ；

shuffle阶段：map端shuffle和reduce端shuffle，详细内容见最新大数据开发面试笔记V4.0

reduce阶段：key相同的数据会调用一次reduce方法，每次调用产生一个键值对，最后将这些键值对写入到HDFS文件中。

4. 写过UDF函数没

写过，在进行count distinct优化的时候，实现了bitmap的创建以及计算功能
UDF主要分为三类，包括udf、udaf、udtf
在创建UDF函数的时候，只需要按照重写固定的重写方法就行了

5. Spark和MapReduce的区别

MapReduce需要将计算的中间结果写入磁盘，然后还要读取磁盘，从而导致了频繁的磁盘IO；而Spark不需要将计算的中间结果写入磁盘，这得益于Spark的RDD弹性分布式数据集和DAG有向无环图，中间结果能够以RDD的形式存放在内存中，这样大大减少了磁盘IO。

MapReduce在shuffle时需要花费大量时间排序，而spark在shuffle时如果选择基于hash的计算引擎，是不需要排序的，这样就会节省大量时间。

MapReduce是多进程模型，每个task会运行在一个独立的JVM进程中，每次启动都需要重新申请资源，消耗了大量的时间；而Spark是多线程模型，每个executor会单独运行在一个JVM进程中，每个task则是运行在executor中的一个线程。

#数据人的面试交流地##秋招的第一个offer，大家都拿到了吗##秋招##大数据开发#

全部评论

推荐最新楼层

牛客823482698号

门头沟学院大数据开发工程师

微众的数据开发和数据仓库有什么区别啊

点赞回复分享

发布于 2023-09-23 13:11 湖北

西安电子科技大学大数据开发工程师

bitmap那部份有详细的解释嘛，求

点赞回复分享

发布于 2023-08-25 11:50 陕西

10-13 12:21

顺丰集团_HR(准入职员工)

顺丰内推，顺丰内推码

10月还有很多HC!!!!java笔试题目：用 Python 实现一个函数，用于计算斐波那契数列的第 n 项。以下 Java 代码片段是否存在问题？如果有，请指出并改正。简述 C++ 中指针和引用的区别。实现一个二叉树的中序遍历算法，可使用递归或非递归方式。对于一个无序整数数组，使用快速排序算法对其进行排序，并分析该算法的时间复杂度和空间复杂度。设计一个算法，判断一个字符串是否为回文串，要求时间复杂度尽可能低。简述 TCP 三次握手和四次挥手的过程，并说明为什么连接建立是三次握手，而连接释放是四次挥手。一台主机的 IP 地址为 192.168.1.100，子网掩码为 255.255.255.0...

点赞评论收藏

分享

10-14 12:20

门头沟学院客户端其它

美团估计要寄

听说美团流程奇快无比 我卡这么久是不是被横向 卡到今天大概率横向没过 难受了

投递美团等公司10个岗位

点赞评论收藏

分享

10-15 16:13

西南石油大学 Java

被招笑hr碰瓷

如图，这是什么心态呢，太搞笑了。

迷茫的大四🐶：那你问他上班之后老实了没

点赞评论收藏

分享

09-28 22:17

已编辑

西安交通大学 Java

非科班java想转测试开发求建议

小女子是天坑专业转码，基础地动山摇，暑假水了一段开发的实习，9月中旬开始投递秋招，投了40+，目前只有一个小厂的开发全部流程走完在等意向，感觉笨人基础实在不行，扛不住开发的面试（写代码也好难好难……），每次面试都非常的恐惧，现在想趁国庆假期学一学测开的知识，重新写一下简历然后投中大厂的测开，有没有路过的佬给点建议？非科班从java到测开真的可以面上吗？有没有推荐的学习路线或者简历写法，小女子将不胜感激。

双非鼠鼠也会梦到大厂...：卧槽，开发和测开一起投吧。感觉这背景去测试屈才了

那些拿到大厂offer的...

点赞评论收藏

分享

评论

5

48

招聘动态

联易融

2026届秋季校园招聘

杉川集团2026届校招

杉尖计划·与杉川一览群山

真格基金

被投企业秋季联合校招

瓴岳科技

2026届“登岳计划”校招启动

Garena

2026秋季校园招聘

华泰证券

2026届Fintech校园招聘

麦吉太文

2026校园招聘

新华三

2026秋招校园招聘

厦门银行

2026届秋季校园招聘

滴滴

2026届秋季校招

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 大厂VS公务员你怎么选 #

46684次浏览 535人参与

# 产品实习，你更倾向大公司or小公司 #

175782次浏览 1994人参与

# 智慧芽求职进展汇总 #

5264次浏览 14人参与

# 发面经攒人品 #

2687413次浏览 36449人参与

# 一汽大众工作体验 #

11617次浏览 23人参与

# 26届秋招公司红黑榜 #

1729次浏览 4人参与

# 未岚大陆求职进展汇总 #

22221次浏览 101人参与

# 机械人的工作环境真的很差吗 #

23621次浏览 117人参与

# 最难的技术面是哪家公司？ #

53063次浏览 881人参与

# 你认为小厂实习有用吗？ #

92838次浏览 604人参与

# 参加完秋招的机械人，还参加春招吗？ #

67220次浏览 596人参与

# 经纬恒润求职进展汇总 #

135879次浏览 1060人参与

# 秋招想进国企该如何准备 #

96791次浏览 483人参与

# 你有哪些缓解焦虑的方法？ #

36269次浏览 829人参与

# 来聊聊机械薪资天花板是哪家 #

146036次浏览 804人参与

# 饿了么求职进展汇总 #

76744次浏览 682人参与

# 我对___祛魅了 #

134184次浏览 743人参与

# 度小满求职进展汇总 #

7137次浏览 40人参与

# 职场捅娄子大赛 #

429137次浏览 4161人参与

# 关于提前批我想问 #

242414次浏览 2284人参与

# 机械人的薪资开到多少，才适合去？ #

134639次浏览 489人参与

# 你现在会用到哪些AI技能？ #

12590次浏览 105人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务