7赞

如何在Scala中部署到YARN的Spark应用程序的applicationId？

作者：爱唱歌的郭少文_ | 2023-09-08 15:19

如何解决《如何在Scala中部署到YARN的Spark应用程序的applicationId？》经验，为你挑选了2个好方法。

我正在使用以下Scala代码(作为自定义spark-submit包装器)将Spark应用程序提交到YARN集群:

val result = Seq(spark_submit_script_here).!!

我在提交时所拥有的只是spark-submit和Spark应用程序的jar(没有SparkContext).我想拍摄applicationId从result,但它是空的.

我可以在命令行中看到输出applicationId和其余的Yarn消息:

INFO yarn.Client:application_1450268755662_0110的应用报告

如何在代码中读取它并获取applicationId？

1> Markon..：

如Spark问题5439中所述，您可以使用SparkContext.applicationId或解析stderr输出。现在，当您用自己的脚本/对象包装spark-submit命令时，我会说您需要阅读stderr并获取应用程序ID。

2> Rajiv..：

如果要通过Python提交作业，则可以通过以下方式获取yarn应用程序ID：

    cmd_list = [{
            'cmd': '/usr/bin/spark-submit --name %s --master yarn --deploy-mode cluster '
                   '--executor-memory %s --executor-cores %s --num-executors %s '
                   '--class %s %s %s'
                   % (
                       app_name,
                       config.SJ_EXECUTOR_MEMORY,
                       config.SJ_EXECUTOR_CORES,
                       config.SJ_NUM_OF_EXECUTORS,
                       config.PRODUCT_SNAPSHOT_SKU_PRESTO_CLASS,
                       config.SPARK_JAR_LOCATION,
                       config.SPARK_LOGGING_ENABLED
                   ),
            'cwd': config.WORK_DIR
        }]
cmd_output = subprocess.run(cmd_obj['cmd'], shell=True, check=True, cwd=cwd, stderr=subprocess.PIPE)
cmd_output = cmd_output.stderr.decode("utf-8")
yarn_application_ids = re.findall(r"application_\d{13}_\d{4}", cmd_output)
                if len(yarn_application_ids):
                    yarn_application_id = yarn_application_ids[0]
                    yarn_command = "yarn logs -applicationId " + yarn_application_id

推荐阅读

程序员
ArrayIndexOutOfBoundsException和IndexOutOfBoundsException之间的区别？

如何解决《ArrayIndexOutOfBoundsException和IndexOutOfBoundsException之间的区别？》经验，为你挑选了1个好方法。 ... [详细]
程序员
FactoMineR MCA中"哪个'不符合逻辑"的含义是什么意思？

如何解决《FactoMineRMCA中"哪个'不符合逻辑"的含义是什么意思？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用form_tag在Rails中上传文件

如何解决《使用form_tag在Rails中上传文件》经验，为你挑选了1个好方法。 ... [详细]
程序员
验证来自iOS transactionReceipt的签名

如何解决《验证来自iOStransactionReceipt的签名》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法启动'./qemu/windows-x86_64/qemu-system-i386.exe':没有此类文件或目录

如何解决《无法启动'./qemu/windows-x86_64/qemu-system-i386.exe':没有此类文件或目录》经验，为你挑选了1个好方法。 ... [详细]
程序员
在python dask中使用分隔符读取csv

如何解决《在pythondask中使用分隔符读取csv》经验，为你挑选了1个好方法。 ... [详细]
程序员
JavaScript显示/隐藏边框/线条

如何解决《JavaScript显示/隐藏边框/线条》经验，为你挑选了0个好方法。 ... [详细]
程序员
C++模板部分特化由指针函数/ const指针函数没有不同？

如何解决《C++模板部分特化由指针函数/const指针函数没有不同？》经验，为你挑选了1个好方法。 ... [详细]
程序员
Docker容器中的Java进程不会在main()的末尾退出

如何解决《Docker容器中的Java进程不会在main()的末尾退出》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么可以在Go中的多个return语句中重新定义err

如何解决《为什么可以在Go中的多个return语句中重新定义err》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用Wifi将Lua脚本上传到NodeMCU

如何解决《使用Wifi将Lua脚本上传到NodeMCU》经验，为你挑选了1个好方法。 ... [详细]
程序员
是没有价值的选择选项,有效吗？

如何解决《是没有价值的选择选项,有效吗？》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Dynamics Ax中获取文件名

如何解决《在DynamicsAx中获取文件名》经验，为你挑选了1个好方法。 ... [详细]
程序员
在iTunesConnect中禁用了创建新版本

如何解决《在iTunesConnect中禁用了创建新版本》经验，为你挑选了1个好方法。 ... [详细]
程序员
命名空间的多个别名？

如何解决《命名空间的多个别名？》经验，为你挑选了2个好方法。 ... [详细]
程序员
一次安装多个NuGet包

如何解决《一次安装多个NuGet包》经验，为你挑选了1个好方法。 ... [详细]
程序员
wp_title过滤器对<title>标记没有任何影响

如何解决《wp_title过滤器对<title>标记没有任何影响》经验，为你挑选了1个好方法。 ... [详细]
程序员
绘制一些不等式作为平面

如何解决《绘制一些不等式作为平面》经验，为你挑选了0个好方法。 ... [详细]
程序员
SVG中的厚Bezier曲线没有伪影

如何解决《SVG中的厚Bezier曲线没有伪影》经验，为你挑选了1个好方法。 ... [详细]
程序员
获取连接失败:php_network_getaddresses:getaddrinfo failed:名称或服务未知

如何解决《获取连接失败:php_network_getaddresses:getaddrinfofailed:名称或服务未知》经验，为你挑选了2个好方法。 ... [详细]

爱唱歌的郭少文_

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章