Pig local mode,group或join = java.lang.OutOfMemoryError:Java堆空间

作者：echo7111436 | 2023-07-12 14:06

如何解决《Piglocalmode,group或join=java.lang.OutOfMemoryError:Java堆空间》经验，为你挑选了1个好方法。

使用Apache Pig版本0.10.1.21(已报告),CentOS版本6.3(最终版),jdk1.6.0_31(Virtualbox上的Hortonworks Sandbox v1.2,3.5 GB RAM)

$ cat data.txt
11,11,22
33,34,35
47,0,21
33,6,51
56,6,11
11,25,67

$ cat GrpTest.pig
A = LOAD 'data.txt' USING PigStorage(',') AS (f1:int,f2:int,f3:int);
B = GROUP A BY f1;
DESCRIBE B;
DUMP B;

pig -x local GrpTest.pig

[Thread-12] WARN  org.apache.hadoop.mapred.JobClient - No job jar file set.  User classes may not be found. See JobConf(Class) or JobConf#setJar(String).
[Thread-12] INFO  org.apache.hadoop.mapreduce.lib.input.FileInputFormat - Total input paths to process : 1
[Thread-13] INFO  org.apache.hadoop.mapred.Task -  Using ResourceCalculatorPlugin : org.apache.hadoop.util.LinuxResourceCalculatorPlugin@19a9bea3
[Thread-13] INFO  org.apache.hadoop.mapred.MapTask - io.sort.mb = 100
[Thread-13] WARN  org.apache.hadoop.mapred.LocalJobRunner - job_local_0002
java.lang.OutOfMemoryError: Java heap space
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.(MapTask.java:949)
    at org.apache.hadoop.mapred.MapTask$NewOutputCollector.(MapTask.java:674)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:756)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
    at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:212)
[main] ERROR org.apache.pig.tools.pigstats.PigStatsUtil - 1 map reduce job(s) failed!
[main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1066: Unable to open iterator for alias B

在Java堆空间:java.lang.OutOfMemoryError每次使用GROUP或加入在本地模式下执行的猪脚本时错误.在HDFS上以mapreduce模式执行脚本时没有错误.

问题1:如果数据样本很小并且本地模式应该使用比HDFS模式更少的资源,那么为什么会出现OutOfMemory错误？

问题2:是否有解决方案在本地模式下成功运行GROUP或JOIN的小型猪脚本？

1> Polymerase..：

解决方案:强制pig为java属性io.sort.mb分配更少的内存我在这里设置为10 MB,错误消失.不确定什么是最好的值,但至少,这允许在本地模式下练习猪语法

$ cat GrpTest.pig
--avoid java.lang.OutOfMemoryError: Java heap space (execmode: -x local)
set io.sort.mb 10;

A = LOAD 'data.txt' USING PigStorage(',') AS (f1:int,f2:int,f3:int);
B = GROUP A BY f1;
DESCRIBE B;
DUMP B;

推荐阅读

程序员
使用ReverseLayout recyclerview将项目添加到Endless Scroll RecyclerView

如何解决《使用ReverseLayoutrecyclerview将项目添加到EndlessScrollRecyclerView》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用BinaryWriter时,为什么二进制文件的大小不会减少

如何解决《使用BinaryWriter时,为什么二进制文件的大小不会减少》经验，为你挑选了1个好方法。 ... [详细]
程序员
鼠标悬停上的边界半径在哪里

如何解决《鼠标悬停上的边界半径在哪里》经验，为你挑选了0个好方法。 ... [详细]
程序员
ColdFusion 10 Developer,Tomcat 7.0.64和多个网站

如何解决《ColdFusion10Developer,Tomcat7.0.64和多个网站》经验，为你挑选了0个好方法。 ... [详细]
程序员
Django Admin不保存预先填充的内联字段,这些字段保留在初始状态

如何解决《DjangoAdmin不保存预先填充的内联字段,这些字段保留在初始状态》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何根据Angular js中的两个自定义过滤器过滤数据

如何解决《如何根据Angularjs中的两个自定义过滤器过滤数据》经验，为你挑选了0个好方法。 ... [详细]
程序员
在PyCharm中运行或调试时增加输出缓冲区

如何解决《在PyCharm中运行或调试时增加输出缓冲区》经验，为你挑选了3个好方法。 ... [详细]
程序员
有条件地阻止方法覆盖

如何解决《有条件地阻止方法覆盖》经验，为你挑选了1个好方法。 ... [详细]
程序员
qDebug()不会打印任何内容

如何解决《qDebug()不会打印任何内容》经验，为你挑选了1个好方法。 ... [详细]
程序员
Android 6.0.1无法以编程方式启用wifi热点

如何解决《Android6.0.1无法以编程方式启用wifi热点》经验，为你挑选了0个好方法。 ... [详细]
程序员
将null值赋给list中的属性

如何解决《将null值赋给list中的属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
电报,获取现有贴纸的file_id

如何解决《电报,获取现有贴纸的file_id》经验，为你挑选了1个好方法。 ... [详细]
程序员
不遵守输入字段的Maxlength属性

如何解决《不遵守输入字段的Maxlength属性》经验，为你挑选了1个好方法。 ... [详细]
程序员
Angular2中的拦截器

如何解决《Angular2中的拦截器》经验，为你挑选了1个好方法。 ... [详细]
程序员
SyntaxError:Object.parse(native)上的意外标记u JSON.parse()的NodeJS

如何解决《SyntaxError:Object.parse(native)上的意外标记uJSON.parse()的NodeJS》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何使用CSS引导类从HTML生成PDF

如何解决《如何使用CSS引导类从HTML生成PDF》经验，为你挑选了0个好方法。 ... [详细]
程序员
在Logstash中解析JSON消息

如何解决《在Logstash中解析JSON消息》经验，为你挑选了0个好方法。 ... [详细]
程序员
将JSON字符串粘贴到Visual Studio中

如何解决《将JSON字符串粘贴到VisualStudio中》经验，为你挑选了1个好方法。 ... [详细]
程序员
从data.frame或data.table构建一个方形邻接矩阵

如何解决《从data.frame或data.table构建一个方形邻接矩阵》经验，为你挑选了2个好方法。 ... [详细]
程序员
大文件和散列 - 性能问题

如何解决《大文件和散列-性能问题》经验，为你挑选了0个好方法。 ... [详细]

echo7111436

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章