A.groupByKey B.map C.filter D.mapValues
A.spark-submit B.spark-shell C.spark-core D.spark-sql
A.寬依賴:指的是多個子RDD的Partition會依賴同一個父RDD的Partition B.窄依賴:指的是每一個父RDD的Partition最多被子RDD的一個Partition使用 C.窄依賴:指的是多個子RDD的Partition會依賴同一個父RDD的Partition D.寬依賴:指的是每一個父RDD的Partition最多被子RDD的一個Partition使用