8赞

尝试使用pyspark加载保存的Spark模型时出现“空集合”错误

作者：ERIK又 | 2023-09-06 13:19

如何解决《尝试使用pyspark加载保存的Spark模型时出现“空集合”错误》经验，为你挑选了0个好方法。

我正在使用Spark构建随机森林模型，我想保存它以便以后使用。我在没有HDFS的pyspark（Spark 2.0.1）上运行此文件，因此文件被保存到本地文件系统。

我已经尝试这样做：

import pyspark.sql.types as T
from pyspark.ml.feature import VectorAssembler
from pyspark.ml.classification import RandomForestClassifier

data = [[0, 0, 0.],
        [0, 1, 1.],
        [1, 0, 1.],
        [1, 1, 0.]]

schema = T.StructType([
    T.StructField('a', T.IntegerType(), True),
    T.StructField('b', T.IntegerType(), True),
    T.StructField('label', T.DoubleType(), True)])

df = sqlContext.createDataFrame(data, schema)

assembler = VectorAssembler(inputCols=['a', 'b'], outputCol='features')
df = assembler.transform(df)

classifier = RandomForestClassifier(numTrees=10, maxDepth=15, labelCol='label', featuresCol='features')
model = classifier.fit(df)

model.write().overwrite().save('saved_model')

然后，加载模型：

from pyspark.ml.classification import RandomForestClassificationModel

loaded_model = RandomForestClassificationModel.load('saved_model')

但是我得到这个错误：

Py4JJavaError: An error occurred while calling o108.load.
: java.lang.UnsupportedOperationException: empty collection

我不确定它指的是哪个集合。有什么想法如何正确加载（或保存）模型吗？

推荐阅读

程序员
ES6类方法在内部引用类实例的最有效方法

如何解决《ES6类方法在内部引用类实例的最有效方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
HTML,身高100%不起作用

如何解决《HTML,身高100%不起作用》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在获取"无法解决放置符号"错误时向Hashmap添加键和值

如何解决《如何在获取"无法解决放置符号"错误时向Hashmap添加键和值》经验，为你挑选了1个好方法。 ... [详细]
程序员
tvos:UITextView焦点外观像电影App

如何解决《tvos:UITextView焦点外观像电影App》经验，为你挑选了0个好方法。 ... [详细]
程序员
QML：即使drag属性处于活动状态，也不会调用onDragStarted / finish

如何解决《QML：即使drag属性处于活动状态，也不会调用onDragStarted/finish》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用enable_if进行C++模板重载:使用g ++和clang进行不同的行为

如何解决《使用enable_if进行C++模板重载:使用g++和clang进行不同的行为》经验，为你挑选了0个好方法。 ... [详细]
程序员
C++ atoi返回错误的值

如何解决《C++atoi返回错误的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法将数据推送到Firebase onclick

如何解决《无法将数据推送到Firebaseonclick》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Symfony2中使用Beip与Liip\FunctionalTestBundle？

如何解决《如何在Symfony2中使用Beip与Liip\FunctionalTestBundle？》经验，为你挑选了0个好方法。 ... [详细]
程序员
在transformClassesWithDexForDebug上Gradle构建缓慢

如何解决《在transformClassesWithDexForDebug上Gradle构建缓慢》经验，为你挑选了4个好方法。 ... [详细]
程序员
Java代理 - 无法正确地从HTTP GET/POST请求交换数据

如何解决《Java代理-无法正确地从HTTPGET/POST请求交换数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在Django 1.9中传递callable

如何解决《如何在Django1.9中传递callable》经验，为你挑选了1个好方法。 ... [详细]
程序员
谷歌地理编码api不如使用地址的谷歌地图准确

如何解决《谷歌地理编码api不如使用地址的谷歌地图准确》经验，为你挑选了0个好方法。 ... [详细]
程序员
以数组形式访问返回的值

如何解决《以数组形式访问返回的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么AppDelegate.swift窗口是可选的？

如何解决《为什么AppDelegate.swift窗口是可选的？》经验，为你挑选了2个好方法。 ... [详细]
程序员
Webpack错误 - 无法解析文件或目录

如何解决《Webpack错误-无法解析文件或目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
指定的LocalDB实例不存在

如何解决《指定的LocalDB实例不存在》经验，为你挑选了0个好方法。 ... [详细]
程序员
Q_OBJECT和moc进行继承

如何解决《Q_OBJECT和moc进行继承》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在目录中的所有文件中搜索字符串？我出现了内存异常

如何解决《如何在目录中的所有文件中搜索字符串？我出现了内存异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Swift中讨论,将来会有新的声明语法吗？

如何解决《在Swift中讨论,将来会有新的声明语法吗？》经验，为你挑选了1个好方法。 ... [详细]

ERIK又

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章