显然,它支持sliding通过mllib如图zero323 这里
sliding
import org.apache.spark.mllib.rdd.RDDFunctions._ val str = "abcdabcd" val rdd = sc.parallelize(str) rdd.sliding(2).map(_.mkString).toLocalIterator.forEach(println)
将会呈现
ab bc cd da ab bc cd