Glue ETL: How to reference config file as extra file using AWS Management Console?(粘合ETL:如何使用AWS管理控制台将配置文件引用为额外文件?)
问题描述
我正在尝试使用Glue ETL作为我的Python脚本的作业计划程序,该脚本还引用JSON配置文件。
根据https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-glue-arguments.html,有一个名为--extra-files
的参数,它被称为指向其他文件(如配置文件)的S3路径。当我创建作业时,似乎在控制台上找不到它。
我所做的是将我的配置文件上传到与我的Glue ETL的Python脚本相同的S3存储桶中,我将其包括在Referenced files path
参数中。
在我的脚本中,我将配置文件引用为:
with open('config.json', 'r') as config:
config = json.load(config)
我的代码逻辑没有任何问题,因为它在本地运行时运行得很好。
但是,当我尝试运行Glue ETL作业时,似乎收到一条失败消息,提示No such file or directory: 'config.json'
。
我在这里做错了什么?如何使用Glue ETL使用我的用例?
推荐答案
这些参数可以作为作业参数传递。在控制台上,它位于创建或编辑作业时的安全配置、脚本库和作业参数(可选)部分下。
根据this answer,如果您在Python外壳作业中使用引用文件路径变量,则被引用的文件位于/tmp
中,其中默认情况下,Python外壳作业没有访问权限。
这篇关于粘合ETL:如何使用AWS管理控制台将配置文件引用为额外文件?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
本文标题为:粘合ETL:如何使用AWS管理控制台将配置文件引用为额外文件?


基础教程推荐
- Kivy 使用 opencv.调整图像大小 2022-01-01
- Python,确定字符串是否应转换为 Int 或 Float 2022-01-01
- 对多索引数据帧的列进行排序 2022-01-01
- 在 Python 中将货币解析为数字 2022-01-01
- 究竟什么是“容器"?在蟒蛇?(以及所有的 python 容器类型是什么?) 2022-01-01
- 在 Django Admin 中使用内联 OneToOneField 2022-01-01
- matplotlib 设置 yaxis 标签大小 2022-01-01
- kivy 应用程序中的一个简单网页作为小部件 2022-01-01
- Python 中是否有任何支持将长字符串转储为块文字或折叠块的 yaml 库? 2022-01-01
- 比较两个文本文件以找出差异并将它们输出到新的文本文件 2022-01-01