Python日志管理
前言
一个长时间运行的项目,不管是从可维护性还是其他角度来说,日志管理都是必不可少的(我相信还有不少同学是直接输出日志到控制台的吧),将日志输出到日志文件中,不仅方便我们查看程序运行时的情况,也可以让我们在项目出现故障时根据运行时产生的日志快速定位问题出现的位置
需要了解的词
- 单例模式:单例模式,也叫单子模式,是一种常用的软件设计模式,属于创建型模式的一种。在应用这个模式时,单例对象的类必须保证只有一个实例存在。许多时候整个系统只需要拥有一个的全局对象,这样有利于我们协调系统整体的行为(Wiki百科),我在另一篇文章里写了Go单例模式的实现:Go单例模式
- 好像暂时没有了,这篇文章很简单
日志级别
Python 标准库 logging 用作记录日志,默认分为六种日志级别(括号为级别对应的数值),NOTSET(0)、DEBUG(10)、INFO(20)、WARNING(30)、ERROR(40)、CRITICAL(50);如果需要自定义日志级别时注意不要和默认的日志级别数值相同,logging 执行时输出大于等于设置的日志级别的日志信息(不重要的不归我管),如设置日志级别是 INFO,则 INFO、WARNING、ERROR、CRITICAL 级别的日志都会输出
日志输出流程
logging输出日志的流程图如下:
我们可以看到流程图中主要的控制类型有这几个:Logger、LogRecord、Filter、Handler、Formatter
- Logger:日志,暴露函数给应用程序,基于日志记录器和过滤器级别决定哪些日志有效
- LogRecord :日志记录器,将日志传到相应的处理器处理
- Handler :处理器, 将(日志记录器产生的)日志记录发送至合适的目的地
- Filter :过滤器, 提供了更好的粒度控制,它可以决定输出哪些日志记录
- Formatter:格式化器, 指明了最终输出中日志记录的布局
代码中的一次日志输出流程为:
- 判断 Logger 对象对于设置的级别是否可用,如果可用,则往下执行,否则,流程结束
- 创建 LogRecord 对象,如果注册到 Logger 对象中的 Filter 对象过滤后返回 False,则不记录日志,流程结束,否则,则向下执行
- LogRecord 对象将 Handler 对象传入当前的 Logger 对象(图中的子流程),如果 Handler 对象的日志级别大于设置的日志级别,再判断注册到 Handler 对象中的 Filter 对象过滤后是否返回 True 而放行输出日志信息,否则不放行,流程结束
- 如果传入的 Handler 大于 Logger 中设置的级别,也即 Handler 有效,则往下执行,否则,流程结束
- 判断这个 Logger 对象是否还有父 Logger 对象,如果没有(代表当前 Logger 对象是最顶层的 Logger 对象 root Logger),流程结束。否则将 Logger 对象设置为它的父 Logger 对象,重复上面的 3、4 两步,输出父类 Logger 对象中的日志输出,直到是 root Logger 为止
实际使用
硬编码方式配置logging
使用basicConfig()
方法
最简单的方式是直接使用logging.basicConfig()
方法默认配置日志,可以满足基本使用,如果方法没有传入参数,会根据默认的配置创建Logger 对象,默认的日志级别被设置为 WARNING,下表为basicConfig()
的可选参数:
Args | Statement |
---|---|
filename | Specifies that a FileHandler be created, using the specified filename, rather than a StreamHandler. |
filemode | Specifies the mode to open the file, if filename is specified (if filemode is unspecified, it defaults to ‘a’. |
format | Use the specified format string for the handler. |
datefmt | Use the specified date/time format. |
style | If a format string is specified, use this to specify the type of format string (possible values ‘%’, ‘{’, ‘$’, for %-formatting, :meth:str.format and :class:string.Template - defaults to ‘%’). |
level | Set the root logger level to the specified level. |
stream | Use the specified stream to initialize the StreamHandler. Note that this argument is incompatible with ‘filename’ - if both are present, ‘stream’ is ignored. |
handlers | If specified, this should be an iterable of already created handlers, which will be added to the root handler. Any handler in the list which does not have a formatter assigned will be assigned the formatter created in this function. |
force | If this keyword is specified as true, any existing handlers attached to the root logger are removed and closed, before carrying out the configuration as specified by the other arguments. |
示例代码如下:
1 | import logging |
输出结果如下:
1 | WARNING:root:This is a warning message |
传入常用的参数,示例代码如下(这里日志格式占位符中的变量放到后面介绍):
1 | import logging |
生成的日志文件 test.log ,内容如下:
1 | 13-10-18 21:10:32 root:DEBUG:This is a debug message |
但是当发生异常时,直接使用无参数的 debug()、info()、warning()、error()、critical() 方法并不能记录异常信息,需要设置 exc_info 参数为 True 才可以,或者使用 exception() 方法,还可以使用 log() 方法,但还要设置日志级别和 exc_info 参数。
1 | import logging |
自定义Logger
basicConfig()
方法只能用于简单日志管理,在多等级多模块的大型项目中并不足以满足我们的需求,这时我们就需要自定义Logger
了一个系统只有一个 Logger 对象,并且该对象不能被直接实例化,没错,这里用到了单例模式,获取 Logger 对象的方法为 getLogger。
注意:这里的单例模式并不是说只有一个 Logger 对象,而是指整个系统只有一个根 Logger 对象,Logger 对象在执行 info()、error() 等方法时实际上调用都是根 Logger 对象对应的 info()、error() 等方法。
我们可以创造多个 Logger 对象,但是真正输出日志的是根 Logger 对象。每个 Logger 对象都可以设置一个名字,如果设置logger = logging.getLogger(__name__)
,name 是 Python 中的一个特殊内置变量,他代表当前模块的名称(默认为 main)。则 Logger 对象的 name 为建议使用使用以点号作为分隔符的命名空间等级制度。
Logger 对象可以设置多个 Handler 对象和 Filter 对象,Handler 对象又可以设置 Formatter 对象。Formatter 对象用来设置具体的输出格式,常用变量格式如下表所示,所有参数见 Python(3.7)官方文档:
format | statement |
---|---|
%(name)s | Name of the logger (logging channel) |
%(levelno)s | Numeric logging level for the message (DEBUG, INFO, WARNING, ERROR, CRITICAL) |
%(levelname)s | Text logging level for the message (“DEBUG”, “INFO”, “WARNING”, “ERROR”, “CRITICAL”) |
%(pathname)s | Full pathname of the source file where the logging call was issued (if available) |
%(filename)s | Filename portion of pathname |
%(module)s | Module (name portion of filename) |
%(lineno)d | Source line number where the logging call was issued (if available) |
%(funcName)s | Function name |
%(created)f | Time when the LogRecord was created (time.time() return value) |
%(asctime)s | Textual time when the LogRecord was created |
%(msecs)d | Millisecond portion of the creation time |
%(relativeCreated)d | Time in milliseconds when the LogRecord was created, relative to the time the logging module was loaded (typically at application startup time) |
%(thread)d | Thread ID (if available) |
%(threadName)s | Thread name (if available) |
%(process)d | Process ID (if available) |
%(message)s | The result of record.getMessage(), computed just as the record is emitted |
Logger 对象和 Handler 对象都可以设置级别,而默认 Logger 对象级别为 30 ,也即 WARNING,默认 Handler 对象级别为 0,也即 NOTSET。logging 模块这样设计是为了更好的灵活性,比如有时候我们既想在控制台中输出DEBUG 级别的日志,又想在文件中输出WARNING级别的日志。可以只设置一个最低级别的 Logger 对象,两个不同级别的 Handler 对象,示例代码如下:
1 | import logging |
控制台输出结果为:
1 | 2018-10-13 23:24:57,832 logger WARNING This is a customer warning message |
文件中输出内容为:
1 | 2018-10-13 23:44:59,817 logger DEBUG This is a customer debug message |
创建了自定义的 Logger 对象,就不要再用 logging 中的日志输出方法了,这些方法使用的是默认配置的 Logger 对象,否则会输出的日志信息会重复。
1 | import logging |
输出结果如下(可以看到日志信息被输出了两遍):
1 | 2018-10-13 22:21:35,873 logger WARNING This is a customer warning message |
config.dictConfig()
方法
除了上面比较杂乱的配置方式外,我们还可以采用字典配置的方式:
从字典中获取配置信息:
1 | import logging.config |
配置文件配置logging
在大型项目中为了安全性及可维护性,配置通常不能采用硬编码的方式,而是需要使用配置文件配置
常见的配置文件有 ini 格式、yaml 格式、JSON 格式,或者从网络中获取都是可以的,只要有相应的文件解析器解析配置即可,其中ini文件配置不需要安装任何解析包
test.ini 文件
1 | [loggers] |
testinit.py 文件
1 | import logging.config |
注意事项
编码问题
编码问题永远是最烦人的问题,FileHandler 创建对象时可以设置文件编码,如果将文件编码设置为 “utf-8”(utf-8 和 utf8 等价),就可以解决中文乱码问题啦。一种方法是自定义 Logger 对象,需要写很多配置;另一种方法是使用默认配置方法 basicConfig(),传入 handlers 处理器列表对象,在其中的 handler 设置文件的编码;关键参考代码如下:
1 | # 自定义 Logger 配置 |
临时禁用日志输出
有时候我们又不想让日志输出,但在这后又想输出日志;一种方法是在使用默认配置时,给 logging.disabled() 方法传入禁用的日志级别,就可以禁止设置级别以下的日志输出了,另一种方法时在自定义 Logger 时,Logger 对象的 disable 属性设为 True,默认值是 False,也即不禁用
1 | logging.disable(logging.INFO) |
日志文件按照时间划分或者按照大小划分
如果将日志保存在一个文件中,那么时间一长,或者日志一多,单个日志文件就会很大,既不利于备份,也不利于查看;我们会想到能不能按照时间或者大小对日志文件进行划分呢?答案肯定是可以的,并且还很简单,logging 考虑到了我们这个需求。logging.handlers 文件中提供了 TimedRotatingFileHandler 和 RotatingFileHandler 类分别可以实现按时间和大小划分。打开这个 handles 文件,可以看到还有其他功能的 Handler 类,它们都继承自基类 BaseRotatingHandler。
1 | # TimedRotatingFileHandler 类构造函数 |
示例代码如下:
1 | # 每隔 1000 Byte 划分一个日志文件,备份文件为 3 个 |
总结
python的logging模块还是非常灵活的,正确使用可以让我们很方便地定位问题和观察项目运行状况(不要再用print输出日志了!!!)