为什么`getNumPartitions()`没有给我"repartition"指定的正确数量的分区？

作者：落单鸟人 | 2023-09-10 09:31

如何解决《为什么`getNumPartitions()`没有给我"repartition"指定的正确数量的分区？》经验，为你挑选了1个好方法。

我有一个textFile和RDD一样:sc.textFile().

我尝试重新分区RDD以加快处理速度:

sc.repartition().

无论我投入什么,它似乎都没有改变,如下所示:

RDD.getNumPartitions()总是打印相同的数字,(3)无论如何.

如何更改分区数以提高性能？

1> Roberto Cong..：

那是因为RDD是不可变的.您无法更改 RDD的分区,但可以创建具有所需分区数的新分区.

scala> val a = sc.parallelize( 1 to 1000)
a: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at  parallelize at :21
scala> a.partitions.size
res2: Int = 4
scala> val b = a.repartition(6)
b: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[4] at repartition at :23
scala> a.partitions.size
res3: Int = 4
scala> b.partitions.size
res4: Int = 6

推荐阅读

程序员
WF4服务问题 - ServiceManagement.svc

如何解决《WF4服务问题-ServiceManagement.svc》经验，为你挑选了0个好方法。 ... [详细]
程序员
成员'计数'含糊不清

如何解决《成员'计数'含糊不清》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Time从今天开始下个月的日期

如何解决《如何使用Time从今天开始下个月的日期》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用Calendar事件获取通知？

如何解决《如何使用Calendar事件获取通知？》经验，为你挑选了0个好方法。 ... [详细]
程序员
离子 - 路线变化事件

如何解决《离子-路线变化事件》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过递归以相反的顺序打印出一行代码

如何解决《通过递归以相反的顺序打印出一行代码》经验，为你挑选了1个好方法。 ... [详细]
程序员
Laravel搜索不存在关系的地方

如何解决《Laravel搜索不存在关系的地方》经验，为你挑选了1个好方法。 ... [详细]
程序员
在页面构造函数中异步调用Web服务

如何解决《在页面构造函数中异步调用Web服务》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Windows上的rStudio上编织标记为pdf时出错43

如何解决《在Windows上的rStudio上编织标记为pdf时出错43》经验，为你挑选了1个好方法。 ... [详细]
程序员
编译器反转C行顺序？

如何解决《编译器反转C行顺序？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何使用SSE执行uint32/float转换？

如何解决《如何使用SSE执行uint32/float转换？》经验，为你挑选了2个好方法。 ... [详细]
程序员
bc(standard_in)1:语法错误

如何解决《bc(standard_in)1:语法错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何为python3和python2分别设置不同的PYTHONPATH变量

如何解决《如何为python3和python2分别设置不同的PYTHONPATH变量》经验，为你挑选了2个好方法。 ... [详细]
程序员
Flask中的自定义中止映射/异常

如何解决《Flask中的自定义中止映射/异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用CowntDownLatch测试强制竞争条件会导致java.lang.IllegalMonitorStateException

如何解决《使用CowntDownLatch测试强制竞争条件会导致java.lang.IllegalMonitorStateException》经验，为你挑选了1个好方法。 ... [详细]
程序员
返回部分视图和消息

如何解决《返回部分视图和消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
来自ajax调用的symfony中的表单验证

如何解决《来自ajax调用的symfony中的表单验证》经验，为你挑选了2个好方法。 ... [详细]
程序员
解释HERE地图实时流量标签

如何解决《解释HERE地图实时流量标签》经验，为你挑选了1个好方法。 ... [详细]
程序员
在函数中使用throw关键字会产生带有gcc的警告

如何解决《在函数中使用throw关键字会产生带有gcc的警告》经验，为你挑选了1个好方法。 ... [详细]
程序员
django I18n javascript_catalog与怪异的反应

如何解决《djangoI18njavascript_catalog与怪异的反应》经验，为你挑选了0个好方法。 ... [详细]

落单鸟人

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章