-
题名基于哈希学习的异常SQL检测
- 1
-
-
作者
李明威
蒋庆远
解银朋
何金栋
吴丹
-
机构
计算机软件新技术国家重点实验室(南京大学)
国家电网福建省电力有限公司电力科学研究院
-
出处
《计算机应用》
CSCD
北大核心
2021年第1期121-126,共6页
-
基金
国家电网总部科技项目(SGGR0000XTJS1900448)。
-
文摘
针对最近邻(NN)方法在异常结构化查询语句(SQL)检测应用中面临的存储开销大、检索速度慢的问题,提出了一种基于哈希学习的异常SQL检测(HMSD)方法。该算法利用哈希学习来学习查询SQL语句的二值编码表示。首先,对查询SQL语句进行清洗去重,从而将查询SQL语句表示为实值特征形式;然后利用等方差哈希方法来学习查询SQL语句的二值编码表示;最后,通过二值编码表示进行检索并提高异常SQL检测的速度。实验结果表明,在异常SQL检测数据集Wafamole上,将数据集进行随机划分,使训练集包含10000条SQL语句,测试集包含30000条SQL语句,在128比特长度下,与最近邻方法相比,所提算法的检测精度提高了1.3%,假正例率(FPR)降低了0.19%,假负例率(FNR)降低了2.41%,检索时间减少了94%,存储开销降低了97.5%;与支持向量机方法相比,所提算法的检测精度提高了0.17%,验证了所提算法能解决最近邻方法在异常SQL检测中存在的问题。
-
关键词
异常SQL检测
最近邻
二值编码表示
哈希学习
大规模检索
-
Keywords
malicious SQL detection
Nearest Neighbor(NN)
binary coding representation
Hash learning
largescale retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-