三石大数据

03-21 08:24 大数据开发工程师

关注

图解Spark第一季【全是大厂面试题！】

Spark作为大数据计算平台后起之秀，在2014年打破了Hadoop保持的基准排序记录，使用206个节点在23分钟里完成了100TB数据的排序，而Hadoop则是使用2000个节点在72分钟的时间里完成同样数据的排序。也就是说，Spark仅用了十分之一的计算资源，获得了比Hadoop快3倍的速度。

为什么速度如此之快？让我们首先探讨一下Spark的底层架构设计，揭示其中的精妙之处。

一、Spark架构设计

面试官：你知道Spark架构吗？

标准答案：我知道的，Spark架构包括控制节点Driver，以及工作节点Executor和集群资源管理器。其中，Diver是整个架构的老大，主要负责资源申请以及任务分配等工作；Executor是一个JVM进程，专门用于计算；集群资源管理器可以是 Spark 自带的资源管理器，也可以是 YARN 或 Mesos 等资源管理框架。总结一下，Spark 采用主从架构，包含一个 Master（即Driver）和若干个 Worker。

如果面试官继续追问：这种架构相比Hadoop有什么优势？

标准答案：与Hadoop MapReduce 计算框架相比，Spark 所采用的 Executor 有两个优点：一是利用多线程来执行具体的任务，减少任务的启动开销，而MapReduce采用的是多进程模型；二是 Executor 中有一个BlockManager存储模块，会将内存和磁盘共同作为存储设备（默认使用内存，当内存不够时，会写到磁盘），当需要多轮迭代计算时，可以将中间结果存储到这个存储模块里，下次需要时，就可以直接读该存储模块里的数据，而不需要读写到 HDFS 等文件系统里，因而有效地减少了 I/O 开销，

如果面试官继续追问：Application、Job、Stage、Task之间的联系是什么？

标准答案：总体而言，在 Spark 中，一个应用（Application）包含若干个作业（Job），一个作业由多个阶段（Stage）构成，一个阶段由多个任务（Task）组成。

如果面试官继续追问：Spark如何运行这些作业？

二、Spark运行基本流程

标准答案：

当一个 Spark 应用被提交时，首先需要为这个应用构建基本的运行环境，即由任务控制节点（Driver）创建一个 SparkContext 对象，由 SparkContext 负责与资源管理器（Cluster Manager）的通信以及进行资源的申请、任务的分配和监控等，SparkContext 会向资源管理器注册并申请运行 Executor的资源，SparkContext 可以看成是应用程序连接集群的通道。
资源管理器为Executor分配资源，并启动Executor进程，Executor运行情况将随着心跳发送到资源管理器上。
SparkContext根据RDD的依赖关系构建DAG图，并将DAG图提交给 DAG 调度器（DAGScheduler）进行解析，将 DAG 图分解成多个阶段（每个阶段都是一个任务集），并且计算出各个阶段之间的依赖关系，然后把一个个“任务集”提交到底层的任务调度器（TaskScheduler）进行处理；Executor 向 SparkContext 申请任务，任务调度器将任务分发给 Executor 运行，同时，SparkContext 将应用程序代码发放给 Executor。
任务在 Executor 上运行，把执行结果反馈给任务调度器，然后反馈给 DAG 调度器，运行完毕后写入数据并释放所有资源。

#数据人的面试交流地##牛客在线求职答疑中心##大数据开发##面试经验#

全部评论

推荐最新楼层

04-24 17:23

京东_零售_java(准入职员工)

京东25实习招聘 base成都测试岗位零售部门

招聘要求如下，但不是硬性要求，都可以投递试试！实习工资高 还有房补，先到先得！招聘全文：【招聘对象】25年毕业的同学，第一学历最低本科最好211，研究生学历要求211 985，全日制，计算机相关专业优先【实习要求】导师同意实习，最少实习3个月，能实习到24年11月中旬优先考虑，支持京东双十一大促备战，实习表现好可直接发25届校招offer，快来投递吧！【岗位要求】1、参与系统的质量保障工作，包括搭建测试环境、测试设计，用例编写和执行；2、定位跟踪产品缺陷，保障产品质量；3、运用提效工具提高测试效率；【工作地点】四川省成都市武侯区潮音路86号京东西南总部大厦【福利待遇】周末双休，餐补、加班打车报...

投递京东等公司10个岗位 >

点赞评论收藏

转发

超脱的椰子在写总结

04-28 11:38

已编辑

重庆邮电大学电子信息类

深圳腾讯找合租室友

马上入职腾讯了，在滨海大厦，有没有小姐姐一起合租呀，目前有2个女生，希望再找一个女生，可以一起合租一个套房，大家住着也安全。另外一个女生在科兴，我们可以找一个离这两个地方都近的小区更新：已经租好了。之后有需要租房的友友可以问问我

点赞评论收藏

转发

图图图图图个钉

03-08 16:11

门头沟学院计算机类

刚聊几句就要免费帮我指导简历了，真没意思

点赞评论收藏

转发

在改简历的ssr很喜欢疯狂星期四

04-18 15:42

北京科技大学天津学院计算机类

点赞评论收藏

转发

还没上岸的小张

04-25 00:15

吉林大学经济学类

双非本985硕，这简历太寒碜了，有没有大佬给指教一下

之前有过车企产品的机会，家里不支持脑子一热给拒了，现在非常后悔，不知道我这种都能去什么岗位啊求大佬们指点指点

最后再改一次简历如何写一份好简历

点赞评论收藏

转发

4 22 评论

招聘动态

滴滴

2025届秋招储备实习生招聘

联易融2024届营销管培生校园招聘

全站热榜

正在热议

# 牛友的五一计划 #

18780次浏览 383人参与

# 晒一晒我的offer #

2832055次浏览 49981人参与

# 牛客帮帮团来啦！有问必答 #

401432次浏览 7837人参与

# 无实习如何秋招上岸 #

173458次浏览 2730人参与

# 如何看待offer收割机的行为 #

194774次浏览 2991人参与

# 如何一边实习一边秋招 #

201975次浏览 4009人参与

# 华为求职进展汇总 #

442959次浏览 4446人参与

# 春招别灰心，我们一人来一句鼓励 #

21606次浏览 314人参与

# 产品实习，你更倾向大公司or小公司 #

31293次浏览 491人参与

# 非技术岗薪资爆料 #

9043次浏览 188人参与

# 硬件人的春招flag #

14570次浏览 199人参与

# 女生做医疗销售有前景吗 #

3899次浏览 49人参与

# 字节跳动工作体验 #

54073次浏览 1579人参与

# 聊聊这家公司值得去吗 #

63828次浏览 1280人参与

# 第一次面试 #

17968次浏览 277人参与

# 在国企工作的人，躺平了吗？ #

73049次浏览 883人参与

# 机械人，你的秋招第一份简历被谁挂了 #

27036次浏览 492人参与

# 来聊聊机械薪资天花板是哪家 #

22972次浏览 180人参与

# 你更愿意参加线上面试还是线下面试？ #

6998次浏览 95人参与

# 如何KTV领导 #

7559次浏览 73人参与

牛客网
牛客企业服务