期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于协议首部的字节频率统计特征发现方法 被引量:2
1
作者 何升 罗军勇 刘琰 《计算机工程》 CAS CSCD 北大核心 2015年第2期272-277,共6页
应用协议识别在网络安全领域具有极其广泛的应用,而如何发现协议特征是协议识别的核心问题。为此,提出一种高效准确的协议特征自动发现方法。利用协议自身的格式特点,将消息进行token化,并根据token序列对消息进行分类。由分类数的变化... 应用协议识别在网络安全领域具有极其广泛的应用,而如何发现协议特征是协议识别的核心问题。为此,提出一种高效准确的协议特征自动发现方法。利用协议自身的格式特点,将消息进行token化,并根据token序列对消息进行分类。由分类数的变化曲线大致判别协议的首部长度,从而确定字频统计的范围。对数据流中每个数据包的消息首部进行字节频率统计,并将字节频率进行归一化处理,得到字节频率特征向量。通过计算待测协议与样本协议的余弦相似度对协议进行分类和识别。实验结果表明,用该方法所提取的特征进行识别,准确率超过93.5%。 展开更多
关键词 协议识别 token化 字节频率 特征向量 余弦相似度
下载PDF
基于Tanimoto系数的JPEG碎片数据识别方法 被引量:7
2
作者 汤燕彬 许榕生 《计算机应用与软件》 CSCD 2011年第9期80-81,92,共3页
当前市面上存在多种功能强大的电子取证工具,但这些取证工具缺乏对特定碎片数据类型的识别。提出满足当前实际需求的一种碎片数据类型识别方法。该方法以数据的字节频率分布为基础,首次将Tanimoto系数应用于JPEG碎片数据类型识别,利用... 当前市面上存在多种功能强大的电子取证工具,但这些取证工具缺乏对特定碎片数据类型的识别。提出满足当前实际需求的一种碎片数据类型识别方法。该方法以数据的字节频率分布为基础,首次将Tanimoto系数应用于JPEG碎片数据类型识别,利用文件类型特有的结构特征以及相邻碎片数据的关联性作为优化参数,提高识别率。实验结果表明,该方法能较好地识别出JPEG碎片数据类型。 展开更多
关键词 计算机取证 JPEG碎片数据 字节频率分布 Tanimoto系数
下载PDF
基于主成分分析和K近邻的文件类型识别算法 被引量:3
3
作者 鄢梦迪 秦琳琳 吴刚 《计算机应用》 CSCD 北大核心 2016年第11期3161-3164,共4页
为解决基于文件后缀名和文件特征标识识别文件类型误判率较高的问题,在基于文件内容识别文件类型的算法基础上,提出主成分分析(PCA)和K近邻(KNN)算法相结合的文件类型识别算法。首先,使用PCA方法对样本预处理以降低样本空间的维数;然后... 为解决基于文件后缀名和文件特征标识识别文件类型误判率较高的问题,在基于文件内容识别文件类型的算法基础上,提出主成分分析(PCA)和K近邻(KNN)算法相结合的文件类型识别算法。首先,使用PCA方法对样本预处理以降低样本空间的维数;然后,对降维后的训练样本集进行聚类处理,即用聚类质心代表每种类型的文件;最后,针对训练样本分布不均匀可能造成的分类误差,提出基于距离加权的KNN算法。实验结果表明,改进算法在样本数较多的情况下,能降低分类的计算复杂度,并保持了较高的识别正确率;而且该算法不依赖文件类型的特征标识,应用范围更为广泛。 展开更多
关键词 文件类型识别 字节频率分布 主成分分析 K近邻
下载PDF
基于自相似的气象数据分类识别方法 被引量:3
4
作者 袁定莲 冯径 +1 位作者 沈晔 张涛 《计算机应用》 CSCD 北大核心 2015年第A02期93-97,共5页
气象卫星和雷达资料的数据文件往往达到几十兆甚至上千兆字节,根据扩展名对文件进行分类仅是一种约定俗成,不具备基于数据特征的属性,因而在一定程度上缺乏可靠性。通过统计分析可得到典型气象数据的一些编码特性,但若对全文件进行值谱... 气象卫星和雷达资料的数据文件往往达到几十兆甚至上千兆字节,根据扩展名对文件进行分类仅是一种约定俗成,不具备基于数据特征的属性,因而在一定程度上缺乏可靠性。通过统计分析可得到典型气象数据的一些编码特性,但若对全文件进行值谱分析,效率低,因此需要研究快速准确的大文件分类识别方法。在研究已有文件分类方法的基础上,分析研究典型气象数据的字节值频率分布统计特征,作为分类的特征参数;采用自相似理论,自适应确定文件的截取长度和截取原点,提出了最小特征文件块指纹模型,设计了基于自相似的大数据文件快速识别算法。实验表明该算法在保证数据类型识别的查准率和查全率的基础上,大幅度减少了大文件数据分类的时间。 展开更多
关键词 字节频率分布 统计分析 自相似 特征文件块 大数据文件分类
下载PDF
面向结构化数据库的敏感属性自动识别方法 被引量:1
5
作者 蔡泽晗 钟保强 +2 位作者 魏莱 何倩 崔玮洪 《自动化与仪器仪表》 2023年第11期82-86,共5页
网络主机结构化数据库对敏感属性信息的识别,需要参考字节频率条件,在信息字节传输频率相对较低的情况下,对敏感属性信息的识别能力也会下降,针对上述问题,提出面向结构化数据库的敏感属性自动识别方法。搭建结构化数据库查询模型,并联... 网络主机结构化数据库对敏感属性信息的识别,需要参考字节频率条件,在信息字节传输频率相对较低的情况下,对敏感属性信息的识别能力也会下降,针对上述问题,提出面向结构化数据库的敏感属性自动识别方法。搭建结构化数据库查询模型,并联合BERT编码器,自主查询敏感属性信息。定义量子密码标准,确定敏感属性信息之间的线性依赖关系,实现敏感属性自动识别。实验结果表明:该方法对结构化数据库的敏感属性信息识别能力较强,有效保障识别效果。 展开更多
关键词 结构化数据库 敏感属性 自动识别 BERT编码器 量子密码 信息熵值 线性依赖关系 字节频率
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部