亚马逊AWS官方博客

RDS MySQL的日志管理

概述

数据库日志是分析研究业务状态的参考资料,也是发生事故或审计时,可追溯检查的最具可靠性和权威性的原始记录,是寻找问题根源的重要的证据之一。

RDS MySQL的默认参数组和选项组并没有打开所有的日志选项。RDS的控制台里提供了把日志直接输出到CloudWatch的方法,可以在CloudWatch里面直接分析日志。如果对于成本比较敏感,我们也可以通过Lambda定期把日志导出到S3做存储和分析。

本教程旨在帮助初次接触RDS并想导出日志的用户,包含以下几部分内容:

  • 通过S3存储桶做日志的生命周期管理
  • 开启RDS(MySQL) 的日志
  • 通过Lambda转储RDS日志

 

通过S3存储桶做日志的生命周期管理

Amazon S3是一种对象存储服务,有行业领先的扩展性、数据可用性、安全性和性能。S3不但能可靠又低成本的保存日志,还能通过生命周期管理功能自动归档或删除过期的日志。

 

创建S3存储桶

因为S3存储桶的名字是DNS的一部分,要起一个独一无二的名字,然后选择区域,创建存储桶。

阻止所有公有访问权限选项默认是选中的,强烈建议不要改这个地方,否则数据有被他人访问的风险。

 

为存储桶设置生命周期管理策略

1)进入存储桶,在管理选项卡内点击+添加生命周期

 

 

2)设置生命周期规则

设立一个30-365为名的规则,30天后自动用智能分层功能降低存储成本,365天后删除日志。

 



 

 

 

开启RDS(MySQL) 的日志

MySQL 有错误日志、慢查询日志、常规日志、审计日志和Binlog。错误日志是默认打开的,慢查询日志和审计日志需要修改参数组才能打开,审计日志需要修改选项组才能打开。Binlog默认不保存。

MySQL RDS 打开方法 默认保存周期
审计日志 修改选项组 文件达到1MiB后轮换,保留9个文件
错误日志 已默认打开 文件每小时轮换一次,保留24小时
慢查询日志 修改参数组 mysql.slow_log表,每24小时轮换
常规日志 修改参数组 mysql.general_log表,每24小时轮换
binlog 执行存储过程 生成后尽快被删除,不保存

创建选项组开启审计日志

注意:更换选项组或修改审计选项不会造成RDS重启,但可能造成连接中断。

支持MySQL5.6和5.7 版本。

1)选择正确的引擎版本,创建选项组

 

 

2)给新创建的选项组增加审计插件选项

默认:保留9个审计文件,每个文件大小1MiB。请根据业务情况修改。

例:100个文件,每个100MiB(占10GiB)

SERVER_AUDIT_FILE_ROTATIONS: 100

SERVER_AUDIT_FILE_ROTATE_SIZE: 100000000

选项的含义和取值范围可参考下面的链接https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/Appendix.MySQL.Options.AuditPlugin.html

 

 

 

开启常规日志和慢查询日志,performance_schema

注意:更换参数组需要重启RDS,更改参数组中的参数可能需要重启RDS。

开启常规日志和慢查询日志会影响DB的性能,尤其是DB负载很高查询很多的时候。因此请根据情况选择是否打开。

修改参数的影响请参考下面的链接:https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/USER_ModifyInstance.MySQL.html#USER_ModifyInstance.MySQL.Settings

1)选择正确的数据库系列,创建参数组

 

 

2)编辑新创建的参数组

存储日志到文件:log_output = FILE

开启常规日志: general_log = 1

开启慢查询日志:slow_query_log = 1

long_query_time = 3.5(记录超过3.5秒的查询)

log_queries_not_using_indexes = 1 (记录未使用索引的查询)

开启performance_schema:performance_schema = 1

RDS参数组没有默认打开performance_schema,建议打开。

 

 

在RDS上保存Binlog

RDS的Binlog生成后会很快被删除。为了故障调查等原因,建议保留一定时间。保留Binlog会占用RDS的磁盘空间。

连上RDS后可以用下面的存储过程行设定Binlog的保存时间,比如24小时

> call mysql.rds_set_configuration(‘binlog retention hours’, 24);

查询当前设置用下面的存储过程

> call mysql.rds_show_configuration;

注:如果要RDS生成Binlog,还需要修改数据库实例,设置备份保留期在1天以上。

下载binlog要用mysqlbinlog程序,详情请参照

https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/USER_LogAccess.Concepts.MySQL.html

 

修改RDS实例,使用新创建的选项组和参数组(需要重启RDS)



 

 

 

 

RDS的Configuration页面是pending-reboot状态,RDS重启后变成in-sync状态,设置生效。

 

 

通过Lambda转储RDS日志

AWS Lambda是无服务器计算服务,可运行代码来响应事件并自动管理底层计算资源。它非常适合在一天导出几次日志这样的场景来使用。

 

代码说明

1)这段代码利用API获得RDS的日志状态。其中describeDBLogFiles获得1小时内新生成的日志一览后依次处理各个日志。downloadDBLogFilePortion下载日志并压缩后存储到Lambda的/tmp临时路径,putObject上传日志文件到S3存储桶。

2)Lambda代码最多运行15分钟,处理能力与分配的内存大小有关。建议分配256MiB以上的内存并指定15分钟的超时时间。如果RDS在业务繁忙时间生成的日志量太大,Lambda不能在15分钟内处理完所有日志,就需要分配更大的内存。

3)Lambda的临时路径/tmp的容量是512MiB,以20%的压缩比率计算,能处理最大2.5GiB的单个日志。

4)Lambda除了基本的执行权限以外,还需要内联策略下载RDS日志,附加AWSLambdaExecute权限上传到S3。

5)日志会储存到指定的存储桶,路径结构如下

<bucket>–RDS–<rds_id>–<log_type>–<YYYY-MM-DD>

 

创建Lambda的步骤

1)从头创建lambda 函数

 

 

这个步骤将创建一个拥有基本的Lambda执行权限的角色。后面第4)步中再给它添加RDS和S3的访问权限。

2)配置一个CloudWatch Events,每小时的第10分钟自动执行Lambda

Schedule可以用Crontab格式:cron(10 * ? * * *)

 

 

 

3)复制示例代码到函数代码框

Lambda示例代码(NodeJS 12):

下面的代码里面,rdsid、bucket、region三个变量需要根据实际情况修改。

const zlib = require('zlib');
const fs = require('fs');
const rdsid = '<your rdsid>';
const bucket = '<your bucket>';
const AWS = require('aws-sdk');
AWS.config.update({region: 'cn-northwest-1'});

function listLog(context) {

        let params = {
                DBInstanceIdentifier: rdsid,
                // filter for non 0-byte file rotated in 1 hour
                FileLastWritten: Date.now() - 3600000,
                FileSize: '1',
                FilenameContains: 'log.'
        };

        let request = new AWS.RDS().describeDBLogFiles(params);
        request.on('success', (response) => {
                console.log(response.data);
                getRdsLog(context, response.data.DescribeDBLogFiles, '0');
        }).on('error', (err) => {
                context.fail(err);
        }).send();
}

function getRdsLog(context, logArray, marker) {

        if (!logArray[0]) return;
        let logObj = logArray[0];
        let s3name = logObj.LogFileName.slice(0,5) + '-' + rdsid + '-' + logObj.LastWritten + '.log.gz';

        let params = {
                DBInstanceIdentifier: rdsid,
                LogFileName: logObj.LogFileName,
                Marker: marker
        };

        let request = new AWS.RDS().downloadDBLogFilePortion(params);
        request.on('success', (response) => {
                console.log(s3name + ' ' + response.data.Marker);
                try {
                        fs.appendFileSync('/tmp/' + s3name, zlib.gzipSync(response.data.LogFileData));
                }
                catch (err) {
                        context.fail(err);
                };
                if (response.data.AdditionalDataPending) {
                        getRdsLog(context, logArray, response.data.Marker);
                }
                else {
                        console.log(s3name + ' downloaded');
                        logArray.shift();
                        putLog(context, s3name, logArray);
                }
        }).on('error', (err) => {
                context.fail(err);
        }).send();
}

function putLog(context, s3name, logArray) {

        let params = {
                Body: fs.readFileSync('/tmp/' + s3name),
                Bucket: bucket,
                ContentType: 'text/plain',
                ContentEncoding: 'gzip',
                ServerSideEncryption: 'AES256',
                Key: 'RDS/' + rdsid + '/' + s3name.slice(0, 5) + '/' + new Date().toISOString().slice(0,10) + '/' + s3name
        };

        let request = new AWS.S3().putObject(params);
        request.on('success', () => {
                console.log(s3name + ' uploaded to S3');
                fs.unlinkSync('/tmp/' + s3name);
                getRdsLog(context, logArray, '0');
        }).on('error', (err) => {
                context.fail(err);
        }).send();
}

exports.handler = function(event, context) {

        listLog(context);
};

粘贴和修改完代码以后,要点击一下画面右上角的保存按钮

4)编辑基本设置中的内存超时

 

权限设置,点击下方查看…角色的链接,为RDS和S3的相关操作附加策略。权限设置完成后再点保存

 

先附加策略AWSLambdaExecute

 

再添加内联策略

 

在JSON窗口粘贴以下内容,创建一个名为LambdaDownloadRDSLog的策略

 

{
    "Version": "2012-10-17",
    "Statement": [
    {
        "Effect": "Allow",
        "Action": [
            "rds:DescribeDBLogFiles",
            "rds:DownloadDBLogFilePortion"
        ],
        "Resource": "*"
    }
  ]
}


 

5)测试Lambda函数

这个Lambda函数是定时驱动的,不需要传入参数。点击测试按钮后用默认事件模版创建一个测试事件,然后再测试



 

执行结果的详细信息里面,会列出describeDBLogFiles获得的1小时内新生成的日志一览,downloadDBLogFilePortion分页下载日志的结果,putObject上传日志文件到S3存储桶的结果。

 

Lambda函数测试通过以后,就可以保存下来。这个函数会被刚才配置的CloudWatch事件定期触发,自动转储日志到S3存储桶。

 

参考链接

1.S3对象生命周期管理:https://docs.thinkwithwp.com/zh_cn/AmazonS3/latest/dev/object-lifecycle-mgmt.html

2.RDS MySQL日志文件:

https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/USER_LogAccess.Concepts.MySQL.html

3.MariraDB审核插件支持:

https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/Appendix.MySQL.Options.AuditPlugin.html

4.修改RDS数据库实例:

https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/USER_ModifyInstance.MySQL.html#USER_ModifyInstance.MySQL.Settings

5.在Lambda控制台配置函数

https://docs.thinkwithwp.com/zh_cn/lambda/latest/dg/configuration-console.html

6.Node.js中的Lambda函数处理程序

https://docs.thinkwithwp.com/zh_cn/lambda/latest/dg/nodejs-handler.html

7.AWS Node.js SDK

https://docs.thinkwithwp.com/AWSJavaScriptSDK/latest/AWS/RDS.html

 

本篇作者

喻亮

AWS解决方案架构师,负责AWS云计算方案的咨询、设计和架构评估。在运维,DevOPS和DBA方面有十余年经验,目前侧重于大数据领域的研究。