19赞

从S3读取csv并使用AWS Lambda插入MySQL表

作者：手机用户2502851955 | 2023-09-06 15:47

如何解决《从S3读取csv并使用AWSLambda插入MySQL表》经验，为你挑选了0个好方法。

我正在尝试自动将csv加载到MySQL表中,当它被收到S3存储桶时.

我的策略是S3在收到指定存储桶中的文件时启动一个事件(我们称之为'bucket-file').这是事件被通知给AWS Lambda函数,该函数将下载并处理将每行插入MySql表的文件(让我们称之为'target_table').

我们必须考虑到RDS在VPC中.

存储桶的当前权限配置为:

{
    "Version": "2008-10-17",
    "Statement": [
        {
            "Sid": "PublicReadForGetBucketObjects",
            "Effect": "Allow",
            "Principal": {
                "AWS": "*"
            },
            "Action": "s3:GetObject",
            "Resource": "arn:aws:s3:::bucket-file/*"
        }
    ]
}

我创建了一个角色,其中包含以下策略:附加到AWS Lambda函数的AmazonS3FullAccess和AWSLambdaVPCAccessExecutionRole.

lambda代码是:

from __future__ import print_function
import boto3
import logging
import os
import sys
import uuid
import pymysql
import csv
import rds_config


rds_host  = rds_config.rds_host
name = rds_config.db_username
password = rds_config.db_password
db_name = rds_config.db_name


logger = logging.getLogger()
logger.setLevel(logging.INFO)

try:
    conn = pymysql.connect(rds_host, user=name, passwd=password, db=db_name, connect_timeout=5)
except Exception as e:
    logger.error("ERROR: Unexpected error: Could not connect to MySql instance.")
    logger.error(e)
    sys.exit()

logger.info("SUCCESS: Connection to RDS mysql instance succeeded")

s3_client = boto3.client('s3')

def handler(event, context):

    bucket = event['Records'][0]['s3']['bucket']['name']
    key = event['Records'][0]['s3']['object']['key'] 
    download_path = '/tmp/{}{}'.format(uuid.uuid4(), key)

    s3_client.download_file(bucket, key,download_path)

    csv_data = csv.reader(file( download_path))

    with conn.cursor() as cur:
        for idx, row in enumerate(csv_data):

            logger.info(row)
            try:
                cur.execute('INSERT INTO target_table(column1, column2, column3)' \
                                'VALUES("%s", "%s", "%s")'
                                , row)
            except Exception as e:
                logger.error(e)

            if idx % 100 == 0:
                conn.commit()

        conn.commit()

    return 'File loaded into RDS:' + str(download_path)

我一直在测试该功能,S3在上传文件时发送事件,Lambda连接到RDS实例并获取通知.我已经检查过桶名称是'bucket-file',文件名也是正确的.问题是当函数到达s3_client.download_file(bucket, key,download_path)它被卡住的行时,直到达到lamdba到期时间.

看着日志,它说:

[INFO]  2017-01-24T14:36:52.102Z    SUCCESS: Connection to RDS mysql instance succeeded
[INFO]  2017-01-24T14:36:53.282Z    Starting new HTTPS connection (1): bucket-files.s3.amazonaws.com
[INFO]  2017-01-24T14:37:23.223Z    Starting new HTTPS connection (2): bucket-files.s3.amazonaws.com
2017-01-24T14:37:48.684Z Task timed out after 60.00 seconds

我还读到,如果您在VPC中工作,为了访问S3存储桶,您必须创建一个VPC端点,以便为该子网授予对S3的访问权限.我也试过这个解决方案,结果是一样的.

我很欣赏一些想法.

提前致谢!

推荐阅读

程序员
如何获取jquery datepicker的当前活动实例

如何解决《如何获取jquerydatepicker的当前活动实例》经验，为你挑选了1个好方法。 ... [详细]
程序员
C#Anti-Debug方法OutputDebugString无法正常工作

如何解决《C#Anti-Debug方法OutputDebugString无法正常工作》经验，为你挑选了1个好方法。 ... [详细]
程序员
缺少"使用严格",即使它已经在文件顶部声明

如何解决《缺少"使用严格",即使它已经在文件顶部声明》经验，为你挑选了1个好方法。 ... [详细]
程序员
AngularJs:ng-如果反应太迟了

如何解决《AngularJs:ng-如果反应太迟了》经验，为你挑选了0个好方法。 ... [详细]
程序员
无法构建gem本机扩展-解决方案

如何解决《无法构建gem本机扩展-解决方案》经验，为你挑选了1个好方法。 ... [详细]
程序员
使用mongo计算所有文档中的数组出现次数

如何解决《使用mongo计算所有文档中的数组出现次数》经验，为你挑选了1个好方法。 ... [详细]
程序员
部署到Visual Studio中找不到的Android设备

如何解决《部署到VisualStudio中找不到的Android设备》经验，为你挑选了2个好方法。 ... [详细]
程序员
如何压缩我的git分支提交到相同的分支没有变基？

如何解决《如何压缩我的git分支提交到相同的分支没有变基？》经验，为你挑选了0个好方法。 ... [详细]
程序员
如何在android中的文本视图中添加动画

如何解决《如何在android中的文本视图中添加动画》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Docker Registry v2中创建只读用户？

如何解决《如何在DockerRegistryv2中创建只读用户？》经验，为你挑选了0个好方法。 ... [详细]
程序员
使用服务器端加密上传到S3期间的数据完整性检查

如何解决《使用服务器端加密上传到S3期间的数据完整性检查》经验，为你挑选了0个好方法。 ... [详细]
程序员
Swift.org与开源swift项目的问题.错误:xcrun:错误:无法找到实用程序"launch-with-toolchain",而不是开发人员工具或PATH

如何解决《Swift.org与开源swift项目的问题.错误:xcrun:错误:无法找到实用程序"launch-with-toolchain",而不是开发人员工具或PATH》经验，为你挑选了1个好方法。 ... [详细]
程序员
SmtpClient无法发送; 雷鸟可以

如何解决《SmtpClient无法发送;雷鸟可以》经验，为你挑选了0个好方法。 ... [详细]
程序员
将Future [List [String]]转换为List [String]

如何解决《将Future[List[String]]转换为List[String]》经验，为你挑选了1个好方法。 ... [详细]
程序员
通过JsonConvert和自定义TypeConverter反序列化对象

如何解决《通过JsonConvert和自定义TypeConverter反序列化对象》经验，为你挑选了0个好方法。 ... [详细]
程序员
Kafka如何处理运行速度比其他消费者慢的消费者？

如何解决《Kafka如何处理运行速度比其他消费者慢的消费者？》经验，为你挑选了1个好方法。 ... [详细]
程序员
selenium-server-standalone.jar和chromedriver之间的版本兼容性？

如何解决《selenium-server-standalone.jar和chromedriver之间的版本兼容性？》经验，为你挑选了1个好方法。 ... [详细]
程序员
来自调试器的Ios Xcode消息:由于内存问题而终止

如何解决《来自调试器的IosXcode消息:由于内存问题而终止》经验，为你挑选了1个好方法。 ... [详细]
程序员
如何在Odoo中重新计算存储的功能字段值？

如何解决《如何在Odoo中重新计算存储的功能字段值？》经验，为你挑选了1个好方法。 ... [详细]
程序员
django-pytest setup_method数据库问题

如何解决《django-pytestsetup_method数据库问题》经验，为你挑选了1个好方法。 ... [详细]

手机用户2502851955

这个屌丝很懒，什么也没留下！

关注作者

Tags | 热门标签

RankList | 热门文章