Spark RDD Lineage存储在哪里?根据关于RDD的白皮书,它持久存储在内存中,但想知道它是在驱动程序端还是在集群上的其他位置.
如何确保容错,即默认创建多少次RDD(元数据)复制?
我想在不使用persist()方法时理解核心框架行为.