当进行导出时,在 Data Wrangler Flow中定义的transform将应用于源数据集,并写入选择的目标位置。
可以通过两种方式导出转换:
通过”Export“功能以编程方式导出,或通过”Create Job“功能以交互方式导出。
Data Wrangler支持通过"create job"按钮将Data Wrangler flow导出到S3或feature store。
要使用"create job"导出data flow,需要创建destination node
和一个Data Wrangler作业来导出数据。创建Data Wrangler作业会启动一个SageMaker处理作业来导出我们的flow。
创建一个destination node
:
“Add a destination"面板出现在右侧。输入dataset name和导出到的S3位置。保留其他所有内容默认,然后单击Add
我们将看到创建的destination node:
单击"export”:
等待导出任务完成,并复制下s3路径:
到s3中下载导出的文件,里面是添加完transform之后的结果: