-
题名基于协议首部的字节频率统计特征发现方法
被引量:2
- 1
-
-
作者
何升
罗军勇
刘琰
-
机构
数学工程与先进计算国家重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2015年第2期272-277,共6页
-
基金
国家自然科学基金资助项目(61309007)
国家"863"计划基金资助项目(2012AA012902)
-
文摘
应用协议识别在网络安全领域具有极其广泛的应用,而如何发现协议特征是协议识别的核心问题。为此,提出一种高效准确的协议特征自动发现方法。利用协议自身的格式特点,将消息进行token化,并根据token序列对消息进行分类。由分类数的变化曲线大致判别协议的首部长度,从而确定字频统计的范围。对数据流中每个数据包的消息首部进行字节频率统计,并将字节频率进行归一化处理,得到字节频率特征向量。通过计算待测协议与样本协议的余弦相似度对协议进行分类和识别。实验结果表明,用该方法所提取的特征进行识别,准确率超过93.5%。
-
关键词
协议识别
token化
字节频率
特征向量
余弦相似度
-
Keywords
protocol identification
tokenization
byte frequency
feature vector
cosine similarity
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-