首页 > 试题广场 >

哪个不是本地模式运行的个条件

[单选题]
哪个不是本地模式运行的个条件
  • spark.localExecution.enabled=true
  • 显式指定本地运行
  • finalStage 无父 Stage
  • partition默认值
handleJobSubmitted
org.apache.spark.scheduler.DAGScheduler#handleJobSubmitted首先会根据RDD创建finalStage。finalStage,顾名思义,就是最后的那个Stage。然后创建job,最后提交。提交的job如果满足一下条件,那么它将以本地模式运行:
1)spark.localExecution.enabled设置为true  并且 2)用户程序显式指定可以本地运行 并且 3)finalStage的没有父Stage 并且 4)仅有一个partition
3)和 4)的话主要为了任务可以快速执行;如果有多个stage或者多个partition的话,本地运行可能会因为本机的计算资源的问题而影响任务的计算速度。
参考:https://blog.csdn.net/anzhsoft/article/details/39859463
编辑于 2020-10-19 20:50:09 回复(0)
Partition只有一个,单个集群
发表于 2021-08-28 06:41:26 回复(0)