3赞

使用Scala从HDFS读取数据

作者：可爱的天使keven_464 | 2023-09-07 15:27

如何解决《使用Scala从HDFS读取数据》经验，为你挑选了1个好方法。

我是Scala的新手.如何使用Scala从HDFS读取文件(不使用Spark)？当我用谷歌搜索它时,我只找到了HDFS的写入选项.

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import java.io.PrintWriter;

/**
* @author ${user.name}
*/
object App {

//def foo(x : Array[String]) = x.foldLeft("")((a,b) => a + b)

def main(args : Array[String]) {
println( "Trying to write to HDFS..." )
val conf = new Configuration()
//conf.set("fs.defaultFS", "hdfs://quickstart.cloudera:8020")
conf.set("fs.defaultFS", "hdfs://192.168.30.147:8020")
val fs= FileSystem.get(conf)
val output = fs.create(new Path("/tmp/mySample.txt"))
val writer = new PrintWriter(output)
try {
    writer.write("this is a test") 
    writer.write("\n")
}
finally {
    writer.close()
    println("Closed!")
}
println("Done!")
}

}

请帮帮我.如何使用scala从HDFS读取文件或加载文件.

1> solar..：

其中一种方式(功能风格)可能是这样的:

val hdfs = FileSystem.get(new URI("hdfs://yourUrl:port/"), new Configuration()) 
val path = new Path("/path/to/file/")
val stream = hdfs.open(path)
def readLines = Stream.cons(stream.readLine, Stream.continually( stream.readLine))

//This example checks line for null and prints every existing line consequentally
readLines.takeWhile(_ != null).foreach(line => println(line))

你也可以看一下这篇文章,或者这里和这里,这些问题看起来与你的相关,并且如果你感兴趣的话,还包含工作(但更像Java的)代码示例.

推荐阅读

程序员
SQL子句与表达式术语

如何解决《SQL子句与表达式术语》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Linux上使用Swift中的C库

如何解决《在Linux上使用Swift中的C库》经验，为你挑选了2个好方法。 ... [详细]
程序员
TortoiseSVN:当我尝试提交时,它不会显示新文件

如何解决《TortoiseSVN:当我尝试提交时,它不会显示新文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
未捕获的TypeError：$（...）。datepicker不是函数

如何解决《未捕获的TypeError：$（）。datepicker不是函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用RSpec/FactoryGirl设置嵌套关联的最佳方法

如何解决《使用RSpec/FactoryGirl设置嵌套关联的最佳方法》经验，为你挑选了0个好方法。 ... [详细]
程序员
亚马逊linux AMI与Ubuntu

如何解决《亚马逊linuxAMI与Ubuntu》经验，为你挑选了1个好方法。 ... [详细]
程序员
redux vs this.state in native native

如何解决《reduxvsthis.stateinnativenative》经验，为你挑选了1个好方法。 ... [详细]
程序员
Symfony 2.8/3.0升级:如何处理带有可变参数的表单类型？

如何解决《Symfony2.8/3.0升级:如何处理带有可变参数的表单类型？》经验，为你挑选了0个好方法。 ... [详细]
程序员
从不同列中获取绝对值的最大值并过滤掉NaN Python

如何解决《从不同列中获取绝对值的最大值并过滤掉NaNPython》经验，为你挑选了1个好方法。 ... [详细]
程序员
在ASP.NET 5中使用MimeMapping(vNext)

如何解决《在ASP.NET5中使用MimeMapping(vNext)》经验，为你挑选了2个好方法。 ... [详细]
程序员
这些向量定义是"常量初始化"吗？

如何解决《这些向量定义是"常量初始化"吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在angularJS控制器中编写Switch语句

如何解决《如何在angularJS控制器中编写Switch语句》经验，为你挑选了1个好方法。 ... [详细]
程序员
在marklogic中搜索特殊字符

如何解决《在marklogic中搜索特殊字符》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Google Maps JS API中制作虚线弯曲折线？

如何解决《如何在GoogleMapsJSAPI中制作虚线弯曲折线？》经验，为你挑选了1个好方法。 ... [详细]
程序员
为什么C# - > CIL在每条指令上都有标签？

如何解决《为什么C#->CIL在每条指令上都有标签？》经验，为你挑选了2个好方法。 ... [详细]
程序员
最后针对所有目标链接库

如何解决《最后针对所有目标链接库》经验，为你挑选了1个好方法。 ... [详细]
程序员
ASP.NET 5 vNext依赖注入(RoleManager)

如何解决《ASP.NET5vNext依赖注入(RoleManager)》经验，为你挑选了1个好方法。 ... [详细]
程序员
必须调用超类'UITableViewHeaderFooterView'的指定初始化程序

如何解决《必须调用超类'UITableViewHeaderFooterView'的指定初始化程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
C程序以友好数字算法返回-1073741819

如何解决《C程序以友好数字算法返回-1073741819》经验，为你挑选了1个好方法。 ... [详细]
程序员
DateField'str'对象没有属性'year'

如何解决《DateField'str'对象没有属性'year'》经验，为你挑选了1个好方法。 ... [详细]

可爱的天使keven_464

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章