17赞

Hadoop中的序列文件

作者：coco2冰冰 | 2023-06-24 12:25

如何解决《Hadoop中的序列文件》经验，为你挑选了1个好方法。

这些序列文件是如何生成的？我在这里看到了关于序列文件的链接,

http://wiki.apache.org/hadoop/SequenceFile

这些是使用默认的Java序列化器编写的吗？以及如何读取序列文件？

1> Lev Khomich..：

序列文件由MapReduce任务生成,并且可以用作在MapReduce作业之间传输数据的通用格式.

您可以通过以下方式阅读它们:

Configuration config = new Configuration();
Path path = new Path(PATH_TO_YOUR_FILE);
SequenceFile.Reader reader = new SequenceFile.Reader(FileSystem.get(config), path, config);
WritableComparable key = (WritableComparable) reader.getKeyClass().newInstance();
Writable value = (Writable) reader.getValueClass().newInstance();
while (reader.next(key, value))
  // perform some operating
reader.close();

您也可以使用SequenceFile.Writer自己生成序列文件.

示例中使用的类如下:

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.SequenceFile;
import org.apache.hadoop.io.Writable;
import org.apache.hadoop.io.WritableComparable;

并包含在hadoop-coremaven依赖项中:


    org.apache.hadoop
    hadoop-core
    1.2.1

推荐阅读

程序员
迭代器begin()应该包含3,输出说2？

如何解决《迭代器begin()应该包含3,输出说2？》经验，为你挑选了1个好方法。 ... [详细]
程序员
以固定的可拖动div为中心

如何解决《以固定的可拖动div为中心》经验，为你挑选了0个好方法。 ... [详细]
程序员
Oracle中日志记录/ nologging选项的用途是什么

如何解决《Oracle中日志记录/nologging选项的用途是什么》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift:如何在一组特定字符后获取所有内容

如何解决《Swift:如何在一组特定字符后获取所有内容》经验，为你挑选了2个好方法。 ... [详细]
程序员
大约每分钟运行一次任务而不使用Thread.Sleep

如何解决《大约每分钟运行一次任务而不使用Thread.Sleep》经验，为你挑选了2个好方法。 ... [详细]
程序员
Marshmallow:无法从服务执行Settings.System.canWrite(Context)

如何解决《Marshmallow:无法从服务执行Settings.System.canWrite(Context)》经验，为你挑选了0个好方法。 ... [详细]
程序员
如果远程删除日历,是否会重复使用Android的"唯一"Calendars._ID值？

如何解决《如果远程删除日历,是否会重复使用Android的"唯一"Calendars._ID值？》经验，为你挑选了0个好方法。 ... [详细]
程序员
导出Dynamics CRM解决方案中的计算字段

如何解决《导出DynamicsCRM解决方案中的计算字段》经验，为你挑选了0个好方法。 ... [详细]
程序员
渲染前景对象中的静态对象/鼠标事件不可见的对象

如何解决《渲染前景对象中的静态对象/鼠标事件不可见的对象》经验，为你挑选了1个好方法。 ... [详细]
程序员
Fastlane提供配置文件疯狂

如何解决《Fastlane提供配置文件疯狂》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在swift中向服务器发出HTTPS请求？

如何解决《如何在swift中向服务器发出HTTPS请求？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Spark:每个执行程序的核心对应用程序运行时没有影响

如何解决《Spark:每个执行程序的核心对应用程序运行时没有影响》经验，为你挑选了1个好方法。 ... [详细]
程序员
套接字编程 - listen()和accept()之间有什么区别？

如何解决《套接字编程-listen()和accept()之间有什么区别？》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何访问超出范围的变量？

如何解决《如何访问超出范围的变量？》经验，为你挑选了1个好方法。 ... [详细]
程序员
多个字段的单个parsley.js错误消息

如何解决《多个字段的单个parsley.js错误消息》经验，为你挑选了1个好方法。 ... [详细]
程序员
无法使用Laravel 5迁移添加外键约束

如何解决《无法使用Laravel5迁移添加外键约束》经验，为你挑选了1个好方法。 ... [详细]
程序员
与骆驼案相关的Laravel多态关系问题

如何解决《与骆驼案相关的Laravel多态关系问题》经验，为你挑选了1个好方法。 ... [详细]
程序员
如果它们通过java包装在缓冲区中,我是否必须明确关闭所有流？

如何解决《如果它们通过java包装在缓冲区中,我是否必须明确关闭所有流？》经验，为你挑选了2个好方法。 ... [详细]
程序员
std ::成员指针行为的元组

如何解决《std::成员指针行为的元组》经验，为你挑选了1个好方法。 ... [详细]
程序员
dask包没有使用所有核心？备择方案？

如何解决《dask包没有使用所有核心？备择方案？》经验，为你挑选了0个好方法。 ... [详细]

coco2冰冰

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章