15赞

java.io.IOException:没有用于scheme的文件系统:hdfs

作者：wurtjq | 2023-09-11 12:40

如何解决《java.io.IOException:没有用于scheme的文件系统:hdfs》经验，为你挑选了1个好方法。

我正在使用Cloudera Quickstart VM CDH5.3.0(就parcels包而言)和Spark 1.2.0 $SPARK_HOME=/opt/cloudera/parcels/CDH-5.3.0-1.cdh5.3.0.p0.30/lib/spark使用命令并使用命令提交Spark应用程序

./bin/spark-submit --class --master spark://localhost.localdomain:7077 --deploy-mode client --executor-memory 4G ../apps/.jar

Spark_App_Main_Class_Name.scala

import org.apache.spark.SparkContext
import org.apache.spark.SparkConf
import org.apache.spark.mllib.util.MLUtils


object Spark_App_Main_Class_Name {

    def main(args: Array[String]) {
        val hConf = new SparkConf()
            .set("fs.hdfs.impl", classOf[org.apache.hadoop.hdfs.DistributedFileSystem].getName)
            .set("fs.file.impl", classOf[org.apache.hadoop.fs.LocalFileSystem].getName)
        val sc = new SparkContext(hConf)
        val data = MLUtils.loadLibSVMFile(sc, "hdfs://localhost.localdomain:8020/analytics/data/mllib/sample_libsvm_data.txt")
        ...
    }

}

但是我在客户端模式下提交应用程序时获得了ClassNotFoundExceptionfororg.apache.hadoop.hdfs.DistributedFileSystem

[cloudera@localhost bin]$ ./spark-submit --class Spark_App_Main_Class_Name --master spark://localhost.localdomain:7077 --deploy-mode client --executor-memory 4G ../apps/Spark_App_Target_Jar_Name.jar
15/11/30 09:46:34 INFO SparkContext: Spark configuration:
spark.app.name=Spark_App_Main_Class_Name
spark.driver.extraLibraryPath=/opt/cloudera/parcels/CDH-5.3.0-1.cdh5.3.0.p0.30/lib/hadoop/lib/native
spark.eventLog.dir=hdfs://localhost.localdomain:8020/user/spark/applicationHistory
spark.eventLog.enabled=true
spark.executor.extraLibraryPath=/opt/cloudera/parcels/CDH-5.3.0-1.cdh5.3.0.p0.30/lib/hadoop/lib/native
spark.executor.memory=4G
spark.jars=file:/opt/cloudera/parcels/CDH-5.3.0-1.cdh5.3.0.p0.30/lib/spark/bin/../apps/Spark_App_Target_Jar_Name.jar
spark.logConf=true
spark.master=spark://localhost.localdomain:7077
spark.yarn.historyServer.address=http://localhost.localdomain:18088
15/11/30 09:46:34 WARN Utils: Your hostname, localhost.localdomain resolves to a loopback address: 127.0.0.1; using 10.113.234.150 instead (on interface eth12)
15/11/30 09:46:34 WARN Utils: Set SPARK_LOCAL_IP if you need to bind to another address
15/11/30 09:46:34 INFO SecurityManager: Changing view acls to: cloudera
15/11/30 09:46:34 INFO SecurityManager: Changing modify acls to: cloudera
15/11/30 09:46:34 INFO SecurityManager: SecurityManager: authentication disabled; ui acls disabled; users with view permissions: Set(cloudera); users with modify permissions: Set(cloudera)
15/11/30 09:46:35 INFO Slf4jLogger: Slf4jLogger started
15/11/30 09:46:35 INFO Remoting: Starting remoting
15/11/30 09:46:35 INFO Remoting: Remoting started; listening on addresses :[akka.tcp://sparkDriver@10.113.234.150:59473]
15/11/30 09:46:35 INFO Remoting: Remoting now listens on addresses: [akka.tcp://sparkDriver@10.113.234.150:59473]
15/11/30 09:46:35 INFO Utils: Successfully started service 'sparkDriver' on port 59473.
15/11/30 09:46:36 INFO SparkEnv: Registering MapOutputTracker
15/11/30 09:46:36 INFO SparkEnv: Registering BlockManagerMaster
15/11/30 09:46:36 INFO DiskBlockManager: Created local directory at /tmp/spark-local-20151130094636-8c3d
15/11/30 09:46:36 INFO MemoryStore: MemoryStore started with capacity 267.3 MB
15/11/30 09:46:38 INFO HttpFileServer: HTTP File server directory is /tmp/spark-7d1f2861-a568-4919-8f7e-9a9fe6aab2b4
15/11/30 09:46:38 INFO HttpServer: Starting HTTP Server
15/11/30 09:46:38 INFO Utils: Successfully started service 'HTTP file server' on port 50003.
15/11/30 09:46:38 INFO Utils: Successfully started service 'SparkUI' on port 4040.
15/11/30 09:46:38 INFO SparkUI: Started SparkUI at http://10.113.234.150:4040
15/11/30 09:46:39 INFO SparkContext: Added JAR file:/opt/cloudera/parcels/CDH-5.3.0-1.cdh5.3.0.p0.30/lib/spark/bin/../apps/Spark_App_Target_Jar_Name.jar at http://10.113.234.150:50003/jars/Spark_App_Target_Jar_Name.jar with timestamp 1448894799228
15/11/30 09:46:39 INFO AppClient$ClientActor: Connecting to master spark://localhost.localdomain:7077...
15/11/30 09:46:40 INFO SparkDeploySchedulerBackend: Connected to Spark cluster with app ID app-20151130094640-0000
15/11/30 09:46:41 INFO NettyBlockTransferService: Server created on 56458
15/11/30 09:46:41 INFO BlockManagerMaster: Trying to register BlockManager
15/11/30 09:46:41 INFO BlockManagerMasterActor: Registering block manager 10.113.234.150:56458 with 267.3 MB RAM, BlockManagerId(, 10.113.234.150, 56458)
15/11/30 09:46:41 INFO BlockManagerMaster: Registered BlockManager
Exception in thread "main" java.lang.RuntimeException: java.lang.ClassNotFoundException: Class org.apache.hadoop.hdfs.DistributedFileSystem not found
    at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:2047)
    at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2578)
    at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2591)
    at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:367)
    at org.apache.spark.util.FileLogger.(FileLogger.scala:90)
    at org.apache.spark.scheduler.EventLoggingListener.(EventLoggingListener.scala:63)
    at org.apache.spark.SparkContext.(SparkContext.scala:352)
    at org.apache.spark.SparkContext.(SparkContext.scala:92)
    at Spark_App_Main_Class_Name$.main(Spark_App_Main_Class_Name.scala:22)
    at Spark_App_Main_Class_Name.main(Spark_App_Main_Class_Name.scala)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.spark.deploy.SparkSubmit$.launch(SparkSubmit.scala:358)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:75)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)
Caused by: java.lang.ClassNotFoundException: Class org.apache.hadoop.hdfs.DistributedFileSystem not found
    at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:1953)
    at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:2045)
    ... 16 more

似乎Spark应用程序无法映射HDFS,因为最初我收到错误:

Exception in thread "main" java.io.IOException: No FileSystem for scheme: hdfs
    at org.apache.hadoop.fs.FileSystem.getFileSystemClass(FileSystem.java:2584)
    at org.apache.hadoop.fs.FileSystem.createFileSystem(FileSystem.java:2591)
    at org.apache.hadoop.fs.FileSystem.get(FileSystem.java:367)
    at org.apache.spark.util.FileLogger.(FileLogger.scala:90)
    at org.apache.spark.scheduler.EventLoggingListener.(EventLoggingListener.scala:63)
    at org.apache.spark.SparkContext.(SparkContext.scala:352)
    at org.apache.spark.SparkContext.(SparkContext.scala:92)
    at LogisticRegressionwithBFGS$.main(LogisticRegressionwithBFGS.scala:21)
    at LogisticRegressionwithBFGS.main(LogisticRegressionwithBFGS.scala)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.spark.deploy.SparkSubmit$.launch(SparkSubmit.scala:358)
    at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:75)
    at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

我按照hadoop No FileSystem for scheme:file将"fs.hdfs.impl"和"fs.file.impl"添加到Spark配置设置

1> Atul Soman..：

您需要在类路径中使用hadoop-hdfs-2.x jar (maven链接).在提交您的申请时,请使用spark-submit的--jar选项提及其他jar位置.

另一方面,你应该理想地转向具有spark1.5的CDH5.5.

推荐阅读

程序员
有没有办法修改正在运行的倒计时？

如何解决《有没有办法修改正在运行的倒计时？》经验，为你挑选了0个好方法。 ... [详细]
程序员
CSS3动画 - 使用转换时不会触发animationstart事件:

如何解决《CSS3动画-使用转换时不会触发animationstart事件:》经验，为你挑选了1个好方法。 ... [详细]
程序员
ObjectMapper.readValue可以返回null值吗？

如何解决《ObjectMapper.readValue可以返回null值吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
NServiceBus作为批处理消息

如何解决《NServiceBus作为批处理消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
Java Array Loop outofbound

如何解决《JavaArrayLoopoutofbound》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++是否使用静态名称解析或动态名称解析？

如何解决《C++是否使用静态名称解析或动态名称解析？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么这个表达式评估为0？

如何解决《为什么这个表达式评估为0？》经验，为你挑选了2个好方法。 ... [详细]
程序员
剥离删除比预期更多的字符

如何解决《剥离删除比预期更多的字符》经验，为你挑选了1个好方法。 ... [详细]
程序员
C++向量迭代错误

如何解决《C++向量迭代错误》经验，为你挑选了1个好方法。 ... [详细]
程序员
反滚动两个div

如何解决《反滚动两个div》经验，为你挑选了0个好方法。 ... [详细]
程序员
c#socket接收字节数组长度

如何解决《c#socket接收字节数组长度》经验，为你挑选了0个好方法。 ... [详细]
程序员
弹簧websocket与sockjs和stomp客户端设计

如何解决《弹簧websocket与sockjs和stomp客户端设计》经验，为你挑选了1个好方法。 ... [详细]
程序员
查找数据框中每行的前N列

如何解决《查找数据框中每行的前N列》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何更有效地检查错误的值

如何解决《如何更有效地检查错误的值》经验，为你挑选了1个好方法。 ... [详细]
程序员
Hibernate Envers:@Audited在一个子类上

如何解决《HibernateEnvers:@Audited在一个子类上》经验，为你挑选了0个好方法。 ... [详细]
程序员
SQL循环,如果BREAK

如何解决《SQL循环,如果BREAK》经验，为你挑选了1个好方法。 ... [详细]
程序员
Enum对象的C#extend方法

如何解决《Enum对象的C#extend方法》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何从FasterXML\Jackson序列化/反序列化布尔值作为Int？

如何解决《如何从FasterXML\Jackson序列化/反序列化布尔值作为Int？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何让JToolBar覆盖整个窗口高度？

如何解决《如何让JToolBar覆盖整个窗口高度？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何处理Redshift中的尺寸类型2缓慢变化？

如何解决《如何处理Redshift中的尺寸类型2缓慢变化？》经验，为你挑选了0个好方法。 ... [详细]

wurtjq

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章