当前位置:  开发笔记 > 编程语言 > 正文

Hive作业失败,返回代码为1,来自org.apache.hadoop.hive.ql.exec.tez.TezTask和查询性能

如何解决《Hive作业失败,返回代码为1,来自org.apache.hadoop.hive.ql.exec.tez.TezTask和查询性能》经验,为你挑选了0个好方法。

我每天都有一个蜂巢工作,计算两个月数据的每个小时的一些聚合.这导致向Tez提交了5760个职位.

作业失败,stderr中出现以下错误:

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.tez.TezTask

该错误可能发生在2300 - 2500 tez作业之后.就在此错误之前,Yarn日志中有以下很多日志:

2015-12-10 21:53:35,286 INFO [TezChild] task.ContainerReporter: Sleeping for 200ms before retrying getTask again. Got null now. Next getTask sleep message after 2000ms

并且单个作业的执行时间大大增加,从20秒到100秒.

我对我的问题没有任何线索,我在yarn,Hadoop,hive或tez日志中找不到任何其他内容(没有例外,没有标记为错误).

所以我有两个问题:在哪里可以找到日志中的更多信息或其他可以帮助我解决此问题的信息?

目前我们使用:

Azure HDInsight 3.2的最新版本

使用C#SDK将作业提交到群集

蜂巢工作使用tez

问题2: 我很确定我们不会以良好的方式进行聚合.对于每个聚合(即每个季度),我们应该检索行的先前值.我希望使用LAG函数,但我们无法传递谓词来查找先前值(我们需要先前值不大于当前值).因此,除了为每个需要计算的季度生成查询之外,我们找不到其他方法.有人知道我们如何在单个配置单元查询中执行此操作吗?

在此先感谢您的帮助,祝您好运

推荐阅读
雯颜哥_135
这个屌丝很懒,什么也没留下!
DevBox开发工具箱 | 专业的在线开发工具网站    京公网安备 11010802040832号  |  京ICP备19059560号-6
Copyright © 1998 - 2020 DevBox.CN. All Rights Reserved devBox.cn 开发工具箱 版权所有