当前位置:  开发笔记 > 编程语言 > 正文

环境变量PYSPARK_PYTHON和PYSPARK_DRIVER_PYTHON

如何解决《环境变量PYSPARK_PYTHON和PYSPARK_DRIVER_PYTHON》经验,为你挑选了2个好方法。

我最近安装了pyspark。它已正确安装。当我在python中使用以下简单程序时,出现错误。

>>from pyspark import SparkContext
>>sc = SparkContext()
>>data = range(1,1000)
>>rdd = sc.parallelize(data)
>>rdd.collect()

在运行最后一行时,出现错误,其关键行似乎是

[Stage 0:>                                                          (0 + 0) / 4]18/01/15 14:36:32 ERROR Executor: Exception in task 1.0 in stage 0.0 (TID 1)
org.apache.spark.api.python.PythonException: Traceback (most recent call last):
  File "/usr/local/lib/python3.5/dist-packages/pyspark/python/lib/pyspark.zip/pyspark/worker.py", line 123, in main
    ("%d.%d" % sys.version_info[:2], version))
Exception: Python in worker has different version 2.7 than that in driver 3.5, PySpark cannot run with different minor versions.Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set.

我在.bashrc中有以下变量

export SPARK_HOME=/opt/spark
export PYTHONPATH=$SPARK_HOME/python3

我正在使用Python 3。



1> buxizhizhoum..:

顺便说一句,如果您使用PyCharm,则可以添加PYSPARK_PYTHONPYSPARK_DRIVER_PYTHON运行/调试以下每个图像的配置



2> Alex..:

您应该在中设置以下环境变量$SPARK_HOME/conf/spark-env.sh

export PYSPARK_PYTHON=/usr/bin/python
export PYSPARK_DRIVER_PYTHON=/usr/bin/python

如果spark-env.sh不存在,可以重命名spark-env.sh.template

推荐阅读
ar_wen2402851455
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有