在YARN上Spark的日志在哪里？

作者：mobiledu2402852357 | 2023-06-13 13:07

如何解决《在YARN上Spark的日志在哪里？》经验，为你挑选了4个好方法。

我是新来的.现在我可以在纱线上运行spark 0.9.1(2.0.0-cdh4.2.1).但执行后没有日志.

以下命令用于运行spark示例.但是,在正常的MapReduce作业中,在历史记录服务器中找不到日志.

SPARK_JAR=./assembly/target/scala-2.10/spark-assembly-0.9.1-hadoop2.0.0-cdh4.2.1.jar \
./bin/spark-class org.apache.spark.deploy.yarn.Client --jar ./spark-example-1.0.0.jar \
--class SimpleApp --args yarn-standalone  --num-workers 3 --master-memory 1g \
--worker-memory 1g --worker-cores 1

我在哪里可以找到logs/stderr/stdout？

有什么地方可以设置配置吗？我确实找到了控制台的输出说:

14/04/14 18:51:52 INFO客户端:ApplicationMaster的命令:$ JAVA_HOME/bin/java -server -Xmx640m -Djava.io.tmpdir = $ PWD/tmp org.apache.spark.deploy.yarn.ApplicationMaster --class SimpleApp --jar ./spark-example-1.0.0.jar --args'yarn-standalone' - worker-memory 1024 --worker-cores 1 --num-workers 3 1> /stdout 2> /stderr

在这一行,请注意 1> $LOG_DIR/stdout 2> $LOG_DIR/stderr

LOG_DIR可以在哪里设置？

1> MARK..：

您可以通过该命令访问日志

yarn logs -applicationId [OPTIONS]

一般选择是:

appOwner - AppOwner(如果未指定,则假定为当前用户)

containerId - ContainerId(如果指定了节点地址,则必须指定)

nodeAddress - 格式的NodeAddress nodename:port(如果指定了容器ID,则必须指定)

例子:

yarn logs -applicationId application_1414530900704_0003                                      
yarn logs -applicationId application_1414530900704_0003 myuserid

// the user ids are different
yarn logs -applicationId  --appOwner

只有当`yarn.log-aggregation-enable`在`yarn-site.xml`中为'true`时才会出现这种情况_并且应用程序已经完成.

2> Roman Nikitc..：

这个问题的漂亮文章:

在YARN上运行Spark - 请参阅"调试应用程序"部分.所有必需示例的体面解释.

要获得正确使用Spark的历史记录服务器,您需要遵循的唯一方法是关闭应用程序中的Spark上下文.否则,应用程序历史记录服务器不会将您视为COMPLETE且不显示任何内容(尽管历史UI可访问但不可见).

3> Somum..：

没有一个答案清楚地说明了在哪里寻找原木(虽然它们分块)所以我把它放在一起.

如果启用了日志聚合(使用yarn.log-aggregation-enable yarn-site.xml),请执行此操作

yarn logs -applicationId

但是,如果没有打开,那么需要继续使用数据节点机器并查看

$HADOOP_HOME/logs/userlogs/application_1474886780074_XXXX/

application_1474886780074_XXXX是应用程序ID

对于像我这样不知道如何获取应用程序ID的人：使用`yarn applications -list`。

4> Carlos Rendo..：

它记录到:

/var/log/hadoop-yarn/containers/[application id]/[container id]/stdout

日志位于运行Spark作业的每个节点上.

推荐阅读

程序员
.NET HttpClient - 取消了CancellationToken而不取消请求

如何解决《.NETHttpClient-取消了CancellationToken而不取消请求》经验，为你挑选了0个好方法。 ... [详细]
程序员
拉出具有依赖关系的无形多态函数

如何解决《拉出具有依赖关系的无形多态函数》经验，为你挑选了0个好方法。 ... [详细]
程序员
排除控制器中的实体结果

如何解决《排除控制器中的实体结果》经验，为你挑选了0个好方法。 ... [详细]
程序员
在*提交之前更改一个特定提交的名称,电子邮件和/或日期

如何解决《在*提交之前更改一个特定提交的名称,电子邮件和/或日期》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#语言规范是否明确声明比较必须是相同的类型？

如何解决《C#语言规范是否明确声明比较必须是相同的类型？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Embeddable Common-Lisp asdf:defsystem返回无效的相对路径名

如何解决《EmbeddableCommon-Lispasdf:defsystem返回无效的相对路径名》经验，为你挑选了1个好方法。 ... [详细]
程序员
不允许使用依赖于Julia中类型定义中的整数类型参数的表达式

如何解决《不允许使用依赖于Julia中类型定义中的整数类型参数的表达式》经验，为你挑选了1个好方法。 ... [详细]
程序员
在共享索引上加入Pandas Dataframes

如何解决《在共享索引上加入PandasDataframes》经验，为你挑选了0个好方法。 ... [详细]
程序员
我的代码输出异常

如何解决《我的代码输出异常》经验，为你挑选了1个好方法。 ... [详细]
程序员
在AOSP上设置默认应用程序

如何解决《在AOSP上设置默认应用程序》经验，为你挑选了1个好方法。 ... [详细]
程序员
从python生成器接收'return'值的最佳方法

如何解决《从python生成器接收'return'值的最佳方法》经验，为你挑选了2个好方法。 ... [详细]
程序员
使用.NET的ANSI着色控制台输出

如何解决《使用.NET的ANSI着色控制台输出》经验，为你挑选了2个好方法。 ... [详细]
程序员
有人可以帮我在java中翻译这行代码吗？

如何解决《有人可以帮我在java中翻译这行代码吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
迭代器begin()应该包含3,输出说2？

如何解决《迭代器begin()应该包含3,输出说2？》经验，为你挑选了1个好方法。 ... [详细]
程序员
以固定的可拖动div为中心

如何解决《以固定的可拖动div为中心》经验，为你挑选了0个好方法。 ... [详细]
程序员
Oracle中日志记录/ nologging选项的用途是什么

如何解决《Oracle中日志记录/nologging选项的用途是什么》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift:如何在一组特定字符后获取所有内容

如何解决《Swift:如何在一组特定字符后获取所有内容》经验，为你挑选了2个好方法。 ... [详细]
程序员
大约每分钟运行一次任务而不使用Thread.Sleep

如何解决《大约每分钟运行一次任务而不使用Thread.Sleep》经验，为你挑选了2个好方法。 ... [详细]
程序员
Marshmallow:无法从服务执行Settings.System.canWrite(Context)

如何解决《Marshmallow:无法从服务执行Settings.System.canWrite(Context)》经验，为你挑选了0个好方法。 ... [详细]
程序员
如果远程删除日历,是否会重复使用Android的"唯一"Calendars._ID值？

如何解决《如果远程删除日历,是否会重复使用Android的"唯一"Calendars._ID值？》经验，为你挑选了0个好方法。 ... [详细]

mobiledu2402852357

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章