RDS MySQL的日志管理

概述

数据库日志是分析研究业务状态的参考资料，也是发生事故或审计时，可追溯检查的最具可靠性和权威性的原始记录，是寻找问题根源的重要的证据之一。

RDS MySQL的默认参数组和选项组并没有打开所有的日志选项。RDS的控制台里提供了把日志直接输出到CloudWatch的方法，可以在CloudWatch里面直接分析日志。如果对于成本比较敏感，我们也可以通过Lambda定期把日志导出到S3做存储和分析。

本教程旨在帮助初次接触RDS并想导出日志的用户，包含以下几部分内容：

通过S3存储桶做日志的生命周期管理
开启RDS(MySQL) 的日志
通过Lambda转储RDS日志

通过S3存储桶做日志的生命周期管理

Amazon S3是一种对象存储服务，有行业领先的扩展性、数据可用性、安全性和性能。S3不但能可靠又低成本的保存日志，还能通过生命周期管理功能自动归档或删除过期的日志。

创建S3存储桶

因为S3存储桶的名字是DNS的一部分，要起一个独一无二的名字，然后选择区域，创建存储桶。

阻止所有公有访问权限选项默认是选中的，强烈建议不要改这个地方，否则数据有被他人访问的风险。

为存储桶设置生命周期管理策略

1)进入存储桶，在管理选项卡内点击+添加生命周期

2)设置生命周期规则

设立一个30-365为名的规则，30天后自动用智能分层功能降低存储成本，365天后删除日志。

开启RDS(MySQL) 的日志

MySQL 有错误日志、慢查询日志、常规日志、审计日志和Binlog。错误日志是默认打开的，慢查询日志和审计日志需要修改参数组才能打开，审计日志需要修改选项组才能打开。Binlog默认不保存。

MySQL RDS	打开方法	默认保存周期
审计日志	修改选项组	文件达到1MiB后轮换，保留9个文件
错误日志	已默认打开	文件每小时轮换一次，保留24小时
慢查询日志	修改参数组	mysql.slow_log表，每24小时轮换
常规日志	修改参数组	mysql.general_log表，每24小时轮换
binlog	执行存储过程	生成后尽快被删除，不保存

创建选项组开启审计日志

注意：更换选项组或修改审计选项不会造成RDS重启，但可能造成连接中断。

支持MySQL5.6和5.7 版本。

1)选择正确的引擎版本，创建选项组

2)给新创建的选项组增加审计插件选项

默认：保留9个审计文件，每个文件大小1MiB。请根据业务情况修改。

例：100个文件，每个100MiB(占10GiB)。

SERVER_AUDIT_FILE_ROTATIONS: 100

SERVER_AUDIT_FILE_ROTATE_SIZE: 100000000

选项的含义和取值范围可参考下面的链接https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/Appendix.MySQL.Options.AuditPlugin.html

开启常规日志和慢查询日志，performance_schema

注意：更换参数组需要重启RDS，更改参数组中的参数可能需要重启RDS。

开启常规日志和慢查询日志会影响DB的性能，尤其是DB负载很高查询很多的时候。因此请根据情况选择是否打开。

修改参数的影响请参考下面的链接：https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/USER_ModifyInstance.MySQL.html#USER_ModifyInstance.MySQL.Settings

1)选择正确的数据库系列，创建参数组

2)编辑新创建的参数组

存储日志到文件：log_output = FILE

开启常规日志： general_log = 1

开启慢查询日志：slow_query_log = 1

long_query_time = 3.5（记录超过3.5秒的查询）

log_queries_not_using_indexes = 1 (记录未使用索引的查询)

开启performance_schema：performance_schema = 1

RDS参数组没有默认打开performance_schema，建议打开。

在RDS上保存Binlog

RDS的Binlog生成后会很快被删除。为了故障调查等原因，建议保留一定时间。保留Binlog会占用RDS的磁盘空间。

连上RDS后可以用下面的存储过程行设定Binlog的保存时间，比如24小时：

> call mysql.rds_set_configuration(‘binlog retention hours’, 24);

查询当前设置用下面的存储过程

> call mysql.rds_show_configuration;

注：如果要RDS生成Binlog，还需要修改数据库实例，设置备份保留期在1天以上。

下载binlog要用mysqlbinlog程序，详情请参照

https://docs.thinkwithwp.com/zh_cn/AmazonRDS/latest/UserGuide/USER_LogAccess.Concepts.MySQL.html

修改RDS实例，使用新创建的选项组和参数组(需要重启RDS)

RDS的Configuration页面是pending-reboot状态，RDS重启后变成in-sync状态，设置生效。

通过Lambda转储RDS日志

AWS Lambda是无服务器计算服务，可运行代码来响应事件并自动管理底层计算资源。它非常适合在一天导出几次日志这样的场景来使用。

代码说明

1)这段代码利用API获得RDS的日志状态。其中describeDBLogFiles获得1小时内新生成的日志一览后依次处理各个日志。downloadDBLogFilePortion下载日志并压缩后存储到Lambda的/tmp临时路径，putObject上传日志文件到S3存储桶。

2)Lambda代码最多运行15分钟，处理能力与分配的内存大小有关。建议分配256MiB以上的内存并指定15分钟的超时时间。如果RDS在业务繁忙时间生成的日志量太大，Lambda不能在15分钟内处理完所有日志，就需要分配更大的内存。

3)Lambda的临时路径/tmp的容量是512MiB，以20%的压缩比率计算，能处理最大2.5GiB的单个日志。

4)Lambda除了基本的执行权限以外，还需要内联策略下载RDS日志，附加AWSLambdaExecute权限上传到S3。

5)日志会储存到指定的存储桶，路径结构如下

创建Lambda的步骤

1)从头创建lambda 函数

这个步骤将创建一个拥有基本的Lambda执行权限的角色。后面第4)步中再给它添加RDS和S3的访问权限。

2)配置一个CloudWatch Events，每小时的第10分钟自动执行Lambda

Schedule可以用Crontab格式：cron(10 * ? * * *)

3)复制示例代码到函数代码框

Lambda示例代码(NodeJS 12)：

下面的代码里面，rdsid、bucket、region三个变量需要根据实际情况修改。

const zlib = require('zlib');
const fs = require('fs');
const rdsid = '<your rdsid>';
const bucket = '<your bucket>';
const AWS = require('aws-sdk');
AWS.config.update({region: 'cn-northwest-1'});

function listLog(context) {

        let params = {
                DBInstanceIdentifier: rdsid,
                // filter for non 0-byte file rotated in 1 hour
                FileLastWritten: Date.now() - 3600000,
                FileSize: '1',
                FilenameContains: 'log.'
        };

        let request = new AWS.RDS().describeDBLogFiles(params);
        request.on('success', (response) => {
                console.log(response.data);
                getRdsLog(context, response.data.DescribeDBLogFiles, '0');
        }).on('error', (err) => {
                context.fail(err);
        }).send();
}

function getRdsLog(context, logArray, marker) {

        if (!logArray[0]) return;
        let logObj = logArray[0];
        let s3name = logObj.LogFileName.slice(0,5) + '-' + rdsid + '-' + logObj.LastWritten + '.log.gz';

        let params = {
                DBInstanceIdentifier: rdsid,
                LogFileName: logObj.LogFileName,
                Marker: marker
        };

        let request = new AWS.RDS().downloadDBLogFilePortion(params);
        request.on('success', (response) => {
                console.log(s3name + ' ' + response.data.Marker);
                try {
                        fs.appendFileSync('/tmp/' + s3name, zlib.gzipSync(response.data.LogFileData));
                }
                catch (err) {
                        context.fail(err);
                };
                if (response.data.AdditionalDataPending) {
                        getRdsLog(context, logArray, response.data.Marker);
                }
                else {
                        console.log(s3name + ' downloaded');
                        logArray.shift();
                        putLog(context, s3name, logArray);
                }
        }).on('error', (err) => {
                context.fail(err);
        }).send();
}

function putLog(context, s3name, logArray) {

        let params = {
                Body: fs.readFileSync('/tmp/' + s3name),
                Bucket: bucket,
                ContentType: 'text/plain',
                ContentEncoding: 'gzip',
                ServerSideEncryption: 'AES256',
                Key: 'RDS/' + rdsid + '/' + s3name.slice(0, 5) + '/' + new Date().toISOString().slice(0,10) + '/' + s3name
        };

        let request = new AWS.S3().putObject(params);
        request.on('success', () => {
                console.log(s3name + ' uploaded to S3');
                fs.unlinkSync('/tmp/' + s3name);
                getRdsLog(context, logArray, '0');
        }).on('error', (err) => {
                context.fail(err);
        }).send();
}

exports.handler = function(event, context) {

        listLog(context);
};

粘贴和修改完代码以后，要点击一下画面右上角的保存按钮。

4)编辑基本设置中的内存和超时

权限设置，点击下方查看…角色的链接，为RDS和S3的相关操作附加策略。权限设置完成后再点保存。

先附加策略AWSLambdaExecute

再添加内联策略

在JSON窗口粘贴以下内容，创建一个名为LambdaDownloadRDSLog的策略

{
    "Version": "2012-10-17",
    "Statement": [
    {
        "Effect": "Allow",
        "Action": [
            "rds:DescribeDBLogFiles",
            "rds:DownloadDBLogFilePortion"
        ],
        "Resource": "*"
    }
  ]
}