假设我有一台机器,我希望能够写入存储在S3存储桶中的某个日志文件.
因此,机器需要具有该存储桶的写入能力,但是,我不希望它能够覆盖或删除该存储桶中的任何文件(包括我想要写入的文件).
所以基本上,我希望我的机器只能将数据附加到该日志文件,而不是覆盖它或下载它.
有没有办法配置我的S3这样工作?也许我可以附加一些IAM策略,以便它可以像我想要的那样工作?
不幸的是,你做不到.
S3没有"附加"操作.*上传对象后,无法对其进行修改; 您唯一的选择是上传新对象以替换它,这不符合您的要求.
*:是的,我知道这篇文章已经有几年了.但它仍然准确.
正如接受的答案所述,你不能.我所知道的最佳解决方案是使用:
AWS Kinesis Firehosehttps://aws.amazon.com/kinesis/firehose/
他们的代码示例看起来很复杂但你的代码可能非常简单.您继续在应用程序中的Kinesis Firehose传输流上执行PUT(或BATCH PUT)操作(使用AWS开发工具包),并配置Kinesis Firehose传输流以将您的流数据发送到您选择的AWS S3存储桶(在AWS Kinesis Firehose控制台).
它仍然不如>>
Linux命令行那么方便,因为一旦你在S3上创建了一个文件,你就必须再次处理下载,追加和上传新文件,但你只需要每批线路做一次而不是每一行数据,所以你不需要担心因为追加操作量而导致的巨额费用.也许它可以完成,但我无法从控制台看到如何做到这一点.
S3上的对象不可追加。在这种情况下,您有2个解决方案:
将所有S3数据复制到新对象,附加新内容并写回S3。
function writeToS3(input) { var content; var getParams = { Bucket: 'myBucket', Key: "myKey" }; s3.getObject(getParams, function(err, data) { if (err) console.log(err, err.stack); else { content = new Buffer(data.Body).toString("utf8"); content = content + '\n' + new Date() + '\t' + input; var putParams = { Body: content, Bucket: 'myBucket', Key: "myKey", ACL: "public-read" }; s3.putObject(putParams, function(err, data) { if (err) console.log(err, err.stack); // an error occurred else { console.log(data); // successful response } }); } }); }
第二种选择是使用Kinesis Firehose。这很简单。您需要创建流水线传送流,并将目标链接到S3存储桶。而已!
function writeToS3(input) { var content = "\n" + new Date() + "\t" + input; var params = { DeliveryStreamName: 'myDeliveryStream', /* required */ Record: { /* required */ Data: new Buffer(content) || 'STRING_VALUE' /* Strings will be Base-64 encoded on your behalf */ /* required */ } }; firehose.putRecord(params, function(err, data) { if (err) console.log(err, err.stack); // an error occurred else console.log(data); // successful response }); }