spark2.0源码阅读--spark作业提交
内容安排按照《apache spark 源码阅读》。这本书基于古老的spark 1.0.2。我看的代码基于2.0。这篇文章先粗略的过一遍spark的核心代码
SparkContext的初始化综述
原书3.2节 p27
sparkContext初始化时主要做这样几件事情:
根据初始化入参生成SparkConf,再根据SparkConf来创建SparkEnv。sparkEnv的主要部件有
cacheManager:用于储存中间计算结果
mapOutputTracker:用来缓存MapStatus信息,并提供从MapOutMaster获取信息的功能。获取的Map out的信息根据master
...