-
题名高性能计算环境中日志模式提炼方法的研究
被引量:1
- 1
-
-
作者
王晓东
赵一宁
肖海力
王小宁
迟学斌
-
机构
中国科学院计算机网络信息中心
中国科学院大学
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第10期2264-2272,共9页
-
基金
中国科学院战略性先导科技专项项目(A类)(XDA19020101)。
-
文摘
日志分析对于计算机系统的稳定运行起着至关重要的作用,然而日志通常是非结构化的,不利于自动化分析,如何自动化将日志的模式提炼出来并变成结构化的数据具有重要的实际意义。提出了LDmatch算法,该算法以单词匹配率为基础实现了一种日志模式提炼算法。传统的日志匹配算法在进行相似度计算时使用一对一单词匹配法,而LDmatch算法根据两条日志所包含的单词之间的最长公共子序列计算日志之间的相似度,并以此为基础进行日志分类。LDmatch算法还能实时得到日志模板并更新。除此之外,该算法的模式仓库使用了基于哈希表的数据结构进行存储,该存储结构细化了日志的分类,减少了日志匹配时的比较次数,从而提高了日志模式提炼算法的匹配效率。为了验证算法的优势,将LDmatch算法应用于开源数据集以及国家高性能计算环境实际产生的日志数据集,并且使用多种其他日志模式提炼算法进行对比并得出实验结果,最终证明了该算法在准确度、鲁棒性和效率上具有优势。
-
关键词
日志模式提炼
单词匹配率
日志模板
哈希表
-
Keywords
log pattern extraction
word matching rate
log template
hash table
-
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
-
-
题名我国南方喀斯特石漠化治理进展
被引量:12
- 2
-
-
作者
陈永毕
熊康宁
池永宽
-
机构
贵州师范大学/国家喀斯特石漠化防治工程技术研究中心
-
出处
《江苏农业科学》
2019年第1期17-21,共5页
-
基金
国家重点研发计划(编号:2016YFC0502607)
-
文摘
南方喀斯特是我国典型的生态脆弱区,石漠化问题是该区域突出的环境问题。从喀斯特脆弱生态系统恢复的角度,以地理-生态过程为主线,从石漠化治理的基础理论和应用研究2个方面总结喀斯特石漠化治理的研究进展,指出基础理论研究在喀斯特脆弱生态系统结构与过程空间尺度耦合研究中的不足,须要进一步发掘技术集成与模式提炼方面的应用研究,工程实施中存在工程落地难、成果巩固难、产业形成难的问题。最后对未来的石漠化治理研究方向提出建议。
-
关键词
中国南方喀斯特
石漠化治理
生态系统
地理-生态过程
技术集成
模式提炼
未来研究方向
-
分类号
X171.4
[环境科学与工程—环境科学]
-