2022-08-13 18:37 广东工业大学大数据开发工程师

关注

大数据面试题——Spark面试题（八）

66、Spark中standalone模式特点，有哪些优点和缺点？

特点

1）standalone是master/slave架构，集群由Master与Worker节点组成，程序通过与Master节点交互申请资源，Worker节点启动Executor运行

2）standalone调度模式使用FIFO调度方式

3）无依赖任何其他资源管理系统，Master负责管理集群资源

优点

1）部署简单

2）不依赖其他资源管理系统

缺点

1）默认每个应用程序会独占所有可用节点的资源，当然可以通过spark.cores.max来决定一个应用可以申请的CPU cores个数

2）可能有单点故障，需要自己配置master HA

67、FIFO调度模式的基本原理、优点和缺点？

基本原理

按照先后顺序决定资源的使用，资源优先满足最先来的job。第一个job优先获取所有可用的资源，接下来第二个job再获取剩余资源。以此类推，如果第一个job没有占用所有的资源，那么第二个job还可以继续获取剩余资源，这样多个job可以并行运行，如果第一个job很大，占用所有资源，则第二job就需要等待，等到第一个job释放所有资源。

优点和缺点

1）适合长作业，不适合短作业

2）适合CPU繁忙型作业（计算时间长，相当于长作业），不利于IO繁忙型作业（计算时间短，相当于短作业）

68、FAIR调度模式的优点和缺点？

所有的任务拥有大致相当的优先级来共享集群资源，spark多以轮训的方式为任务分配资源，不管长任务还是端任务都可以获得资源，并且获得不错的响应时间，对于短任务，不会像FIFO那样等待较长时间了，通过参数spark.scheduler.mode 为FAIR指定。

69、使用scala代码实现WordCount？

 val conf = new SparkConf()   val sc = new SparkContext(conf)   val line = sc.textFile("xxxx.txt") line.flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_). collect().foreach(println) sc.stop()

70、Spark RDD 和 MapReduce2的区别？

1）mr2只有2个阶段，数据需要大量访问磁盘，数据来源相对单一 ,spark RDD ,可以无数个阶段进行迭代计算，数据来源非常丰富，数据落地介质也非常丰富spark计算基于内存

2）MapReduce2需要频繁操作磁盘IO，需要大家明确的是如果是SparkRDD的话，你要知道每一种数据来源对应的是什么，RDD从数据源加载数据，将数据放到不同的partition针对这些partition中的数据进行迭代式计算计算完成之后，落地到不同的介质当中

72、Spark sql为什么比hive快呢？

计算引擎不一样，一个是spark计算模型，一个是mapreudce计算模型

72、spark为什么比Mapreduce快？快在哪里呢？

Spark更加快的主要原因有几点：

1）基于内存计算，减少低效的磁盘交互

2）高效的调度算法，基于DAG

3）容错机制Lingage，主要是DAG和Lianage，即使spark不使用内存技术，也大大快于mapreduce。

73、RDD的数据结构是怎么样的？一个RDD对象，包含如下5个核心属性。

1）一个分区列表，每个分区里是RDD的部分数据（或称数据块）

2）一个依赖列表，存储依赖的其他RDD

3）一个名为compute的计算函数，用于计算RDD各分区的值

4）分区器（可选），用于键/值类型的RDD，比如某个RDD是按散列来分区

5）计算各分区时优先的位置列表（可选），比如从HDFS上的文件生成RDD时，RDD分区的位置优先选择数据所在的节点，这样可以避免数据移动带来的开销

74、RDD算子里操作一个外部map，比如往里面put数据，然后算子外再遍历map，会有什么问题吗？

频繁创建额外对象，容易oom

75、说说你对Hadoop生态的认识。

hadoop生态主要分为三大类型

1）分布式系统：HDFS，hbase

2）分布式计算引擎：Spark，MapReduce

3）周边工具：如zookeeper，pig，hive，oozie，sqoop，ranger，kafka等

76、hbase region多大会分区，spark读取hbase数据是如何划分partition的？

region超过了hbase.hregion.max.filesize这个参数配置的大小就会自动裂分，默认值是1G。默认情况下，hbase有多少个region，Spark读取时就会有多少个partition

#大数据开发工程师面经##大数据#

全部评论

推荐最新楼层

浙江大学后端工程师

觉得spark东西挺多的啊

点赞回复分享

发布于 2022-08-14 11:34

10-05 15:45

浙江工业大学集成电路IC设计

租房一定要看一度电费和有没有冰箱

这个很有话语权了，就不谈上海的租房了。当时在金华有在外租房住过四五个月。金华的房价相对比价便宜了，当时我租的时候一室一卫一平台，是800一个月，但是水电要自费。以前租过没带冰箱的房子，绝对达咩，常驻的话肯定离不开买菜啊，水果这些，尤其是夏天，没有冰箱的话，肉一个晚上就完蛋。还有就是一定要朝南的方位，除此之外，水费到时无所谓，反正花不了多少，电费一定要注意，你要看下空调的等级，还有一度电多少钱，当初我租房一度是1.5，还没有分什么谷电和峰电，尤其是夏天，空调是三级，当时没注意，一个月烧了五六百加上洗衣机。一定要和房东提前确认好，还有中途退行不行，以及离开后是否要付清洁费。最重要的是如果水管或者什...

我的租房踩坑经历

点赞评论收藏

分享

10-02 12:16

思摩尔国际（SMOORE）_IT开发工程师(准入职员工)

思摩尔内推，思摩尔内推码

思摩尔结构工程师一面一面技术面，面试官比较年轻，共23min1、面试官上来要求先说说你对思摩尔的了解2、自我介绍3、针对第一个项目的提问：项目背景？你承担的工作？你在项目中遇到的问题？你最大的收获？这些项目中设计的产品有在企业中应用过吗？没有应用的原因你觉得是什么？4、针对第二个项目的提问：在项目中成员有分歧怎么办？有人不配合怎么办？5、除了学校学习和项目科研的内容，你最近有学习过什么新技术吗？6、反问环节（最长的一次）面试官详细介绍了工作内容后续流程，还有总部的一轮面试思摩尔国际2026全球校园招聘9.5正式启动【关于我们】思摩尔国际（HK6969）成立于2009年，是提供雾化科技解决方案的...

点赞评论收藏

分享

09-01 16:09

门头沟学院 Java

兄弟们，美团是真不看笔试啊，30号笔试的时候和b站笔试冲突了，想了想美团可以顺延还是做了b站的，结果今天看了一下直接免笔试了😂

自来熟的放鸽子能手面...：不看，0 0 0照样一周意向

投递美团等公司10个岗位

点赞评论收藏

分享

08-28 14:40

浙江工业大学 Java

根本没投海康，但是刚才突然收到笔试，有没有uu知道这是什么情况😂

站队站对牛：还是浙江学校欢迎

投递海康威视等公司10个岗位

点赞评论收藏

分享

10-05 17:25

温州大学 golang

国庆怎么还没过去

国庆后约了一场面试，现在一直在焦虑 第一次觉得国庆有这么的漫长，每时每刻都很煎熬啊 能不能让我直接面完结束呀

NAce：一样，9号约了面试

，从未感到国庆假期如此之长过

点赞评论收藏

分享

评论

6

12

招聘动态

平安产险科技中心

2026届校园招聘

字节跳动火山引擎

2026校园招聘

滴滴

2026届秋季校招

联想

2026届校园招聘

字节跳动

2026校园招聘

联想

26届AI专项｜内推码NK2026

快手

2026届校园招聘

联想

2026届校园招聘

开启无限 “芯” 可能

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习什么时候入职 #

306651次浏览 2122人参与

# 牛油的搬砖plog #

112669次浏览 817人参与

# 携程求职进展汇总 #

640668次浏览 4660人参与

# 金融财经春招备战日记 #

30502次浏览 166人参与

# 制造业的秋招小结 #

116532次浏览 1972人参与

# 招聘要求与实际实习内容不符怎么办 #

130083次浏览 824人参与

# 深信服秋招来了 #

272696次浏览 2905人参与

# 你朋友圈最大的人脉是谁？ #

22854次浏览 145人参与

# 如果没找到工作，考公是你的退路吗 #

49909次浏览 398人参与

# 工作两年想退休了 #

164343次浏览 1420人参与

# 什么样的背景能拿SSP? #

113432次浏览 404人参与

# 26届的你，投了哪些公司？ #

194099次浏览 1189人参与

# 非技术er求职现状 #

102418次浏览 672人参与

# 校招入职后的感受 #

379712次浏览 3224人参与

# 如何快速融入团队？ #

33744次浏览 280人参与

# 你在职场中沾染到的“坏”习惯 #

22503次浏览 145人参与

# 你做过哪些dirty work #

18965次浏览 139人参与

# 听到哪句话就代表面试稳了or挂了？ #

216471次浏览 1586人参与

# 大学四年该怎么过，才不算浪费时间？ #

13761次浏览 80人参与

# 国庆假期，给大脑放个假 #

6017次浏览 50人参与

# 如果公司降薪，你会跳槽吗？ #

98205次浏览 632人参与

# 你小时候最想从事什么职业 #

124380次浏览 1924人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务