计算机上对网络浏览证据准确提取仿真研究被引量：4

On the Computer to the Network Browsing Evidence Accurate Extraction Simulation Research

下载PDF

导出

摘要在计算机上对网络浏览证据准确提取,可以协助追查泄露信息。首先应对网络浏览文本数据进行分类,挖掘分类后的频繁项集,构成满足阈值要求的网络浏览文本痕迹记录并进行提取,最终实现对网络浏览证据准确提取,但是传统方法通过计算两点距离,采用平方和直接比较结果完成提取,但是不能对网络浏览文本数据进行分类,无法挖掘其中的频繁项集,导致不能获取相关阈值对网络浏览证据提取,提出一种数据挖掘的计算机上对网络浏览证据准确提取方法。首先,运用朴素贝叶斯算法对网络浏览文本数据进行预测并将其归类,对每个训练样本数据进行计算,并求解出其分类到某个类别的概率,对比预测结果后将样本归并到高级别概率中,实现文本数据的归类;然后,利用频繁序列模式挖掘算法,对归类后的文本数据时间序列结构进行分析,通过采用可信度与支持度阈值规则,从文本数据时间序列中找到频繁序列,构成满足阈值要求的网络浏览文本痕迹记录并进行提取,最终实现对网络浏览证据准确提取。仿真结果表明,文中数据挖掘算法与计算机痕迹提取技术相结合,有效地提高了提取网络浏览证据的效率。 In this paper, we propose an accurate extraction method of network browse evidence on computer based on data mining. Firstly, the research predicted text data of network browse and carried out classification for it using naive Bayes algorithm, then calculated every training sample data and solved out probability of its classification to some category. The research merged the samples to high-grade probability after comparing the prediction results to a- chieve classification of text data. Moreover, the research used algorithm of frequent sequence pattern mining to ana- lyze classified time series structure of text data and found out frequent sequence from time series of text data through using threshold value rule of reliability degree and support degree. The research built text trace record of network browse satisfying with threshold value requirement to carry out extraction. Simulation results show that it can improve the extraction efficiency of network browse evidence to integrate text data-mining algorithm with the extraction tech- nology of computer trace.

作者王晓立

机构地区山西大学商务学院

出处《计算机仿真》北大核心 2017年第7期240-243,共4页 Computer Simulation

关键词网络浏览证据数据挖掘算法痕迹提取 Network browsing evidence Data mining algorithm Trace extraction

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1高杨.计算机网络信息安全及其防护策略的研究[J].科技创新导报,2014,11(21):47-47. 被引量：6
2王中州.一种计算机网络多媒体影视教学系统设计[J].电子设计工程,2016,24(1):66-68. 被引量：6
3常艳,李佳林.计算机犯罪点线面侦查法研究[J].辽宁警察学院学报,2015,17(5):66-71. 被引量：1
4陶姿邑,毕善为.浏览器取证技术[J].计算机系统应用,2014,23(5):8-15. 被引量：3
5甘杨兰,赵梅,牛森,邹国兵.基于云仿真环境数据挖掘的服务分类方法[J].计算机仿真,2014,31(10):460-465. 被引量：10
6狄岚,于晓瞳,梁久祯.基于信息浓缩的隐私保护支持向量机分类算法[J].计算机应用,2016,36(2):392-396. 被引量：10
7卢伟胜,郭躬德,严宣辉,陈黎飞.SMwKnn:基于类别子空间距离加权的互k近邻算法[J].计算机科学,2014,41(2):166-169. 被引量：7
8邸鹏,段利国.一种新型朴素贝叶斯文本分类算法[J].数据采集与处理,2014,29(1):71-75. 被引量：51
9汤龙.数据挖掘在计算机取证分析中的应用研究[J].电脑知识与技术（过刊）,2015,21(6X):16-17. 被引量：4

二级参考文献88

1杨青.计算机犯罪的侦查取证[J].山东警察学院学报,2003,15(6):35-37. 被引量：5
2赵世奇,张宇,刘挺,陈毅恒,黄永光,李生.基于类别特征域的文本分类特征选择方法[J].中文信息学报,2005,19(6):21-27. 被引量：21
3赵梦笔.基于流媒体技术的现代远程教学系统设计综述[J].现代情报,2007,27(6):204-205. 被引量：11
4盛骤,谢式千,潘乘毅.概率论与数理统计[M].北京:高等教育出版社,2010.
5MitchellTM著曾华军张银奎译.机器学习[M].北京:机械工业出版社,2003..
6Mitchell T M. Machine Learning[M]. McGraw-Hill Companies Inc, 1997 : 230-247.
7Cover T M, Hart P E. Nearest Neighbor Pattern Classification [J]. IEEE Trans on Informati on Theory, 1967 ,13(1) : 21-27.
8Wu X D, Kumar V,Quinlan J R,et al. Top 10 algorithms indata mining[J]. Knowl Inf Syst, 2008,14 : 1-37.
9Dudani S A. The Distance-weighted kNearest Neighbor Rule [J]. IEEE Transactions on System, Man and Cybernetics, 1976, SMC-6 (4) : 325-327.
10Liu H W, Zhang S C. Noisy data elimination using mutualk-nea- rest neighbor for classification mining[J]. The Journalof Sys- tems and Software, 2012(85):1067-1074.

共引文献89

1兰天,郭躬德.基于RSKNN分类改进算法[J].计算机系统应用,2013,22(12):85-92.
2柴丹炜,邵思思,张若昕,乐光学,刘建生.网络舆论话题分类算法研究与实证分析[J].嘉兴学院学报,2014,26(6):116-123. 被引量：2
3杨阳,张文生.基于深度学习的图像自动标注算法[J].数据采集与处理,2015,30(1):88-98. 被引量：26
4吴斌,李冠辰,刘宇,张雷,王柏.基于微博重复发送的垃圾用户甄别[J].数据采集与处理,2015,30(1):117-125. 被引量：1
5史源.计算机网络信息安全及防护策略研究[J].计算机光盘软件与应用,2015,18(1):202-202. 被引量：14
6崔宾阁,庄仲杰.基于最佳距离度量的两层最近邻分类算法[J].山东科技大学学报（自然科学版）,2015,34(3):20-27. 被引量：3
7朱贺军,陈正东.大数据环境下加密网络行为的快速识别[J].中国西部科技,2015,14(7):6-7.
8裴向杰,唐红昇,陈鹏.一种改进的贝叶斯算法在短信过滤中的研究[J].计算机技术与发展,2015,25(9):89-93. 被引量：2
9曾俊杰,王晓明,杨晓欢.基于局部保持的KNN算法[J].西华大学学报（自然科学版）,2015,34(6):58-63.
10郭金玲,樊东燕,郭虎升.一种动态的主动多分类方法[J].数据采集与处理,2016,31(1):152-159.

同被引文献34

1韦炜,全渝娟,卓奕涛,陈学亮,林艳.基于多阶马尔可夫预测的个性化推荐算法[J].计算机工程,2015,41(11):59-66. 被引量：9
2于岩,陈鸿昶,于洪涛.基于RBF神经网络的微博用户兴趣预测模型[J].计算机应用研究,2015,32(12):3555-3559. 被引量：9
3孔翔宇,毕秀春,张曙光.财经新闻与股市预测——基于数据挖掘技术的实证分析[J].数理统计与管理,2016,35(2):215-224. 被引量：30
4荣盘祥,曾凡永,黄金杰.数据挖掘中特征选择算法研究[J].哈尔滨理工大学学报,2016,21(1):106-109. 被引量：14
5许丽娟.基于自适应波束形成的高维数据挖掘算法[J].电声技术,2016,40(3):65-68. 被引量：5
6钟翔,高勇,邬伦.基于链接分析的网页文本核心地名提取方法[J].地球信息科学学报,2016,18(4):435-442. 被引量：3
7罗阳倩子.大规模数据集高效数据挖掘算法研究[J].湖南城市学院学报（自然科学版）,2016,25(4):111-112. 被引量：2
8黄杰华,何龙,张明棣,颜宇春,马彬,张晓东.应用数据挖掘算法预测台风条件下PM_(2.5)质量浓度[J].环境监测管理与技术,2016,28(3):54-57. 被引量：1
9马月坤,刘鹏飞.基于知识库的客户网购意向预测系统[J].计算机工程与应用,2016,52(13):101-109. 被引量：7
10赵学健,孙知信,袁源.基于预判筛选的高效关联规则挖掘算法[J].电子与信息学报,2016,38(7):1654-1659. 被引量：34

引证文献4

1孙娜.自然语言文本中否定性信息智能抽取仿真[J].计算机仿真,2018,35(12):276-279. 被引量：2
2孙少叶,温晓光.互联网下零售电子商务用户浏览优化预测[J].计算机仿真,2018,35(6):412-416.
3赵建华.光纤通信网络非平稳数据智能挖掘仿真研究[J].计算机仿真,2020,37(3):324-327. 被引量：11
4刘亚男.基于加权关联规则的数据共享效果跟踪方法设计[J].河北北方学院学报（自然科学版）,2022,38(3):43-47. 被引量：1

二级引证文献14

1张磊.人工智能背景下计算机自然语言的处理[J].新一代信息技术,2020,3(17):44-47. 被引量：1
2闫俊辉,闫鑫.基于数据挖掘的复杂光纤网络运行状态检测研究[J].激光杂志,2021,42(9):94-97. 被引量：2
3赵海燕,杜丽娟,刘琨,刘建国.分布式光纤预警系统同质序列数据异常模式挖掘方法[J].激光杂志,2022,43(9):134-138. 被引量：2
4魏爽,江荣旺,乔艳琰.基于无证书代理环签名的光纤通信数据加密传输[J].激光杂志,2022,43(9):154-158. 被引量：4
5万四维,廖肇毅,何俊达.基于深度学习的高压开关柜负荷数据智能挖掘系统设计[J].电子设计工程,2022,30(24):157-161. 被引量：12
6李健,马延周,胡瑞娟.基于深度学习的轻量级自然语言描述生成算法[J].计算机仿真,2022,39(10):369-372. 被引量：1
7乔艳琰,魏爽.基于深度学习的多通道光纤数据安全融合方法[J].激光杂志,2022,43(11):99-103. 被引量：1
8赵伟,王文娟.基于深度信念网络的光通信网络数据异常识别研究[J].激光杂志,2023,44(1):174-178. 被引量：3
9蔡崇武.基于载波调制的光纤通信网络传输质量提升方法[J].激光杂志,2023,44(3):185-189. 被引量：4
10沈小渝,李晗,李红映.基于自适应遗传算法的无线激光通信网络负载均衡成簇算法[J].激光杂志,2023,44(3):205-209. 被引量：2

1王灿伟.基于主题提取的海量微博情感分析[J].南京大学学报（自然科学版）,2017,53(3):549-556. 被引量：7
2张宸,韩夏.大数据环境下基于SVM-WNB的网络舆情分类研究[J].统计与决策,2017,33(14):45-48. 被引量：17
3陈湘辉.基于朴素贝叶斯算法的社交网络数据挖掘技术研究[J].计算机测量与控制,2017,25(6):199-202. 被引量：10
4朱美玲,刘晨,王雄斌,韩燕波.基于车牌识别流数据的车辆伴随模式发现方法[J].软件学报,2017,28(6):1498-1515. 被引量：11
5马淼,李贻斌.基于多级图像序列和卷积神经网络的人体行为识别[J].吉林大学学报（工学版）,2017,47(4):1244-1252. 被引量：9
6王祖铭,严郁,张忆,肖富男,朱伟,邵勤.基于MSP430单片机的电子艾灸盒设计[J].中国医疗设备,2017,32(5):44-46. 被引量：9
7马清亮,杨海燕,吴旭光.多项式模糊系统混合H_2/H_∞控制[J].电光与控制,2017,24(7):1-6. 被引量：1
8张进,王贵成,汪滢.基于模糊聚类的谷氨酸发酵过程故障诊断研究[J].沈阳化工大学学报,2017,31(2):182-187. 被引量：5
9杨宇,邹臣嵩,谭永洲.一种基于序列聚类的现代学徒制课程体系建构方法[J].韶关学院学报,2017,38(6):21-26. 被引量：2
10杨丹丹,关维国.基于S变换模矩阵的电能质量暂态检测[J].计算机系统应用,2017,26(7):183-188. 被引量：2

计算机仿真

2017年第7期

浏览历史

内容加载中请稍等...

计算机上对网络浏览证据准确提取仿真研究被引量：4

参考文献9

二级参考文献88

共引文献89

同被引文献34

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

计算机上对网络浏览证据准确提取仿真研究 被引量：4

参考文献9

二级参考文献88

共引文献89

同被引文献34

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

计算机上对网络浏览证据准确提取仿真研究被引量：4