14赞

如何在tf.Transform中使用Google DataFlow Runner和Templates？

作者：手机用户2402852387 | 2023-06-10 20:05

如何解决《如何在tf.Transform中使用GoogleDataFlowRunner和Templates？》经验，为你挑选了1个好方法。

我们正在Google Cloud上建立机器学习管道,利用GC ML-Engine进行分布式TensorFlow培训和模型服务,并利用DataFlow进行分布式预处理作业.

我们希望在Google Cloud上运行我们的Apache Beam应用程序作为DataFlow作业.看看ML-Engine样本 ,似乎可以得到tensorflow_transform.beam.impl AnalyzeAndTransformDataset来指定使用哪个PipelineRunner,如下所示:

from tensorflow_transform.beam import impl as tft
pipeline_name = "DirectRunner"
p = beam.Pipeline(pipeline_name) 
p | "xxx" >> xxx | "yyy" >> yyy | tft.AnalyzeAndTransformDataset(...)

TemplatingDataflowPipelineRunner提供了将预处理开发与参数化操作分开的功能 - 请参阅此处:https://cloud.google.com/dataflow/docs/templates/overview-基本上:

A)在PipelineOptions派生类型中,将选项类型更改为ValueProvider(python方式:类型推断或类型提示???)

B)将跑步者改为TemplatingDataflowPipelineRunner

C) mvn原型:生成以GCS存储模板(python方式:像TF Hypertune一样的yaml文件???)

D)运行gcloud beta数据流作业--gcs-location -parameters

现在的问题是:你能告诉我,我们怎能用tf.Transform利用TemplatingDataflowPipelineRunner？

1> María García..：

Python模板于2017年4月开始提供(参见文档).操作它们的方法如下:

定义从PipelineOptions子类化的UserOptions.

使用add_value_provider_argument API添加要参数化的特定参数.

使用argparse的add_argument将继续定义常规的非参数化选项.

class UserOptions(PipelineOptions):
     @classmethod
     def _add_argparse_args(cls, parser):
         parser.add_value_provider_argument('--value_provider_arg', default='some_value')
         parser.add_argument('--non_value_provider_arg', default='some_other_value')

请注意,Python没有TemplatingDataflowPipelineRunner,Java 2.X也不像(Java 1.X中发生的那样).

推荐阅读

程序员
xcodebuild命令行挂起

如何解决《xcodebuild命令行挂起》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何找到嵌套元组的维度？

如何解决《如何找到嵌套元组的维度？》经验，为你挑选了2个好方法。 ... [详细]
程序员
OSX - 如何从命令行获取文件的创建和修改时间

如何解决《OSX-如何从命令行获取文件的创建和修改时间》经验，为你挑选了2个好方法。 ... [详细]
程序员
在Swift中通过TouchID生成哈希或字符串

如何解决《在Swift中通过TouchID生成哈希或字符串》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用dplyr中的mutate_each将所有数值变量转换为factor

如何解决《使用dplyr中的mutate_each将所有数值变量转换为factor》经验，为你挑选了1个好方法。 ... [详细]
程序员
类型擦除和可变模板成员函数

如何解决《类型擦除和可变模板成员函数》经验，为你挑选了1个好方法。 ... [详细]
程序员
FFMPEG:Transmux mpegts到mp4给出错误:muxer不支持非可搜索输出

如何解决《FFMPEG:Transmuxmpegts到mp4给出错误:muxer不支持非可搜索输出》经验，为你挑选了1个好方法。 ... [详细]
程序员
我的哈希表比二进制搜索慢

如何解决《我的哈希表比二进制搜索慢》经验，为你挑选了0个好方法。 ... [详细]
程序员
对C中的指针和泛型(void)指针感到困惑

如何解决《对C中的指针和泛型(void)指针感到困惑》经验，为你挑选了1个好方法。 ... [详细]
程序员
在Gradle中的自定义任务中运行任务

如何解决《在Gradle中的自定义任务中运行任务》经验，为你挑选了1个好方法。 ... [详细]
程序员
Swift错误"无法下标类型[Uint8]的值"

如何解决《Swift错误"无法下标类型[Uint8]的值"》经验，为你挑选了1个好方法。 ... [详细]
程序员
webpack找不到节点模块('bootstrap-multiselect')

如何解决《webpack找不到节点模块('bootstrap-multiselect')》经验，为你挑选了1个好方法。 ... [详细]
程序员
是否可以实现"继续作为{Facebook用户名}"按钮？

如何解决《是否可以实现"继续作为{Facebook用户名}"按钮？》经验，为你挑选了0个好方法。 ... [详细]
程序员
即使文件存在,AVAudioFile.length也为0

如何解决《即使文件存在,AVAudioFile.length也为0》经验，为你挑选了0个好方法。 ... [详细]
程序员
比较具有相同键的两个哈希数组

如何解决《比较具有相同键的两个哈希数组》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何有效地将归纳类型转换为共感类型(无递归)？

如何解决《如何有效地将归纳类型转换为共感类型(无递归)？》经验，为你挑选了0个好方法。 ... [详细]
程序员
为什么不能使用符号来调用受保护的方法？

如何解决《为什么不能使用符号来调用受保护的方法？》经验，为你挑选了0个好方法。 ... [详细]
程序员
Datalist奇怪的行为

如何解决《Datalist奇怪的行为》经验，为你挑选了0个好方法。 ... [详细]
程序员
Azure B2C-多个答复网址

如何解决《AzureB2C-多个答复网址》经验，为你挑选了1个好方法。 ... [详细]
程序员
将当前文件与VS2015 TFS Git源代码控制中的历史版本进行比较

如何解决《将当前文件与VS2015TFSGit源代码控制中的历史版本进行比较》经验，为你挑选了1个好方法。 ... [详细]

手机用户2402852387

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章