摘要
针对日志格式异构造成的日志解析局限性问题,文章介绍了一种基于正则表达式日志数据分组提取的方法,采用日志格式描述与日志内容解析相分离的策略,使用XML语言编写日志格式描述和日志数据项说明的脚本文档,该脚本文档与日志类别相对应,与具体的解析程序分离,提高了日志解析系统的灵活性和扩展性。
Aiming at the limitation of log parsing caused by the heterogeneity of log format, this paper introduces a method of log data group extraction based on regular expression, which adopts the strategy of separating log format description from log content parsing, and uses XML language to write the script document of log format description and log data item description. The script document corresponds to the log category and specific the separation of parsers improves the flexibility and expansibility of log parsing system.
作者
张军
王芬芬
Zhang Jun;Wang Fenfen(Hunan Railway Professional Technology College,Zhuzhou 412001,China)
出处
《无线互联科技》
2020年第3期48-49,共2页
Wireless Internet Technology
基金
2018年度湖南省教育厅科学研究项目,项目编号:18C1528。
关键词
日志解析
正则表达式
可扩展标记语言
log parsing
regular expression
extensible markup language