我通过使用HiveContext
而不是SQLContext
如下更正了此问题:
import findspark findspark.init() import pyspark from pyspark.sql import HiveContext sqlCtx= HiveContext(sc) spark_df = sqlCtx.read.format('com.databricks.spark.csv').options(header='true', inferschema='true').load("./data/documents_topics.csv") spark_df.registerTempTable("my_table") sqlCtx.sql("CREATE TABLE my_table_2 AS SELECT * from my_table")