我有一个数据集[String],需要转换为RDD [String].怎么样?
注意:我最近从spark 1.6迁移到spark 2.0.我的一些客户期待RDD,但现在Spark给了我数据集.
如scala API文档中所述,您可以调用.rdd数据集:
.rdd
val myRdd : RDD[String] = ds.rdd