基于密度与距离的钓鱼邮件检测方法被引量：1

Phishing E-mail Detection Method Based on Density and Distance

下载PDF

导出

摘要针对钓鱼邮件检测过程中提取特征数量愈加庞大,检测效果没有明显提升且时间成本增加这一问题,提出了一种钓鱼邮件检测方法.该方法提出将原始的42维邮件特征转换为2个新特征,即基于密度的特征和基于距离的特征,检测准确率最高可达99. 74%,分类时间仅需3. 39 s,是传统算法的1/20.实验结果表明,该方法具有较好的检测效果,并且降低了时间成本. Phishing E-mail detection methods are mostly focused on the extraction of different E-mail features, which lead the time increasing. To solve this problem, a method based on density and distance was proposed. The method replaces the 42 original mail features with 2 new ones, i. e., features based on density and distance. Then the machine learning classification algorithm was used to detect phishing E-mail. The detection accuracy of the proposed method reaches 99.74%, and time is only 3.39 s, which is 1/20 of the traditional algorithm. Results show that the algorithm has a better detection performance and saves much time.

作者王秀娟张晨曦唐昊阳陶元睿 WANG Xiujuan;ZHANG Chenxi;TANG Haoyang;TAO Yuanrui(Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China)

机构地区北京工业大学信息学部

出处《北京工业大学学报》 CAS CSCD 北大核心 2019年第6期546-553,共8页 Journal of Beijing University of Technology

基金国家重点研发计划资助项目(2017YFB0802703) 国家自然科学基金资助项目(61602052)

关键词机器学习钓鱼邮件特征提取维度缩减支持向量机 machine learning phishing E-mail feature extraction dimensionality reduction supportvector machine (SVM)

分类号 TP393.098 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1杨明,杜彦辉,刘晓娟.网络钓鱼邮件分析系统的设计与实现[J].中国人民公安大学学报（自然科学版）,2012,18(2):61-65. 被引量：5
2Xiujuan Wang,Chenxi Zhang,Kangfeng Zheng.Intrusion Detection Algorithm Based on Density,Cluster Centers,and Nearest Neighbors[J].China Communications,2016,13(7):24-31. 被引量：6
3邹学强,张鹏,黄彩云,陈志鹏,孙永,刘庆云.基于页面布局相似性的钓鱼网页发现方法[J].通信学报,2016,37(S1):116-124. 被引量：7
4郑金彬,卓义宝.基于密度的分布式聚类算法研究[J].计算机工程,2008,34(17):65-67. 被引量：5
5WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：63

二级参考文献39

1姚君兰.入侵检测技术及其发展趋势[J].信息技术,2006,30(4):172-175. 被引量：9
2卢秉亮,王玉湘,许莉.基于WINDOWS环境POP3协议邮件接收客户端的实现[J].沈阳航空工业学院学报,2006,23(3):27-30. 被引量：2
3陈涓,郭传雄.网络钓鱼攻击的在线检测及防治[J].解放军理工大学学报（自然科学版）,2007,8(2):133-138. 被引量：6
4Ankerst M, Breunig M M, Kriegel H P, et al. Ordering Points to Identify the Clustering Structure[C]//Proc. of ACM SIGMOD International Conference on Management of Data. Philadelphia, USA: ACM Press, 1999.
5Brecheisen S, Kriegel H R Kroger P, et al. Visually Mining Through Cluster Hierarchies[C]//Proc. of SIAM Int'l Conf. on Data Mining. Orlando, USA: [s. n.], 2004.
6Ester M, Kriegel H P, Sander J, et al. Incremental Clustering for Mining in a Datawarehousing Environment[C]//Proc. of the 24th Int'l Conf. on Very Large Databases. New York, USA: [s. n.], 1998.
7Ester M, Kriegel H R Sander J, et al. A Density-based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C]//Proc. of the 2nd Int'l Conf. on Knowledge Discovery and Data Mining. Portland, USA: AAAI Press, 1996.
8Januzaj E, Kriegel H E Pfeifle M. Density-based Distributed Clustering[C]//Proc. of the 9th Int'l Conf. on Extending Database Technology. Heraklion, Greece: [s. n.], 2004.
9周文林.网络钓鱼更趋猖獗[N].经济参考报,2011—04-26(7).
10A. Rodriguez and A. Laio, "Clustering by fast search and find of density peaks", Science, Voi.344, No.6191, pp.1492-1496, 2014.

共引文献81

1陆小莉,刘强,徐生霞.中国产业转型升级的空间分异与影响机制研究[J].经济问题探索,2021(2):135-144. 被引量：6
2钱鑫,张龙波,田爱奎,邓齐志,汪金苗.一种面向数据密集型计算环境的聚类算法[J].济南大学学报（自然科学版）,2013,27(1):11-15. 被引量：3
3冯少荣,张东站.基于中心点及密度的分布式聚类算法[J].计算机工程,2010,36(19):56-58.
4赵恩来,郝文宁,赵飞,陈刚,邵校莎莎.改进的基于密度的航迹聚类算法[J].计算机工程,2011,37(9):270-272. 被引量：15
5林秀丹,毛国君.基于密度网格的分布式数据流聚类算法[J].计算机工程,2012,38(16):70-73. 被引量：6
6周磊.浅谈社会工程学攻击与防范[J].计算机光盘软件与应用,2013,16(15):146-146. 被引量：5
7李延,王大魁,耿晶,王树良.数据质量聚类算法[J].武汉大学学报（信息科学版）,2019,44(1):153-158. 被引量：3
8WANG Shuliang,LI Qi,YUAN Hanning,GENG Jing,DAI Tianru,DENG Chenwei.Robust Clustering with Topological Graph Partition[J].Chinese Journal of Electronics,2019,28(1):76-84. 被引量：2
9Ziling Pang,Guoyin Wang,Jie Yang.A Multi-granularity Decomposition Mechanism of Complex Tasks Based on Density Peaks[J].Big Data Mining and Analytics,2018,1(3):245-256. 被引量：3
10陶辉.基于密度峰值选取聚类中心的优化[J].内江科技,2016,37(10):31-33. 被引量：1

同被引文献9

1沈春龙,彭勇,周琦,王克鸿.高能电子束活性区空间能量密度测量系统[J].焊接学报,2017,38(10):16-20. 被引量：4
2刘业森,张晓蕾,郭良.自然灾害调查数据的多尺度异常检测方法研究及应用[J].地球信息科学学报,2017,19(12):1653-1660. 被引量：7
3余立苹,李云飞,朱世行.基于高维数据流的异常检测算法[J].计算机工程,2018,44(1):51-55. 被引量：22
4王玉坤,曹召良,李大禹,徐焕宇,宣丽.液晶-变形镜自适应光学系统的数据采集与处理软件设计[J].光学精密工程,2018,26(6):1507-1516. 被引量：6
5陈静.联合智能优化和分簇CS的WSNs稀疏数据采集[J].计算机工程与应用,2017,53(24):263-270. 被引量：8
6李新鹏,高欣,阎博,陈春旭,陈斌,李军良,徐建航.基于孤立森林算法的电力调度流数据异常检测方法[J].电网技术,2019,43(4):1447-1456. 被引量：95
7周广平,石然,胡羽行,董健腾,高福隆.Microblaze软核处理器在惯测数据采集中的应用[J].电子器件,2019,42(3):698-701. 被引量：5
8杨宏宇,李博超.基于逆向习得推理的网络异常行为检测模型[J].计算机应用,2019,39(7):1967-1972. 被引量：11
9潘志安,刘庆杰,王小英,孙晓叶.基于改进聚类算法的卫星数据异常检测模型[J].科技通报,2018,34(7):128-131. 被引量：9

引证文献1

1魏欢.复杂网络混合属性数据流密度检测方法研究[J].商丘师范学院学报,2021,37(9):6-9.

1郑先伟.教育网内需防范高发邮件钓鱼攻击[J].中国教育网络,2018(10):57-57.
2邵萍萍.基于数据挖掘的船舶入侵数据建模方法[J].舰船科学技术,2019,41(6):130-132. 被引量：2
3黑客入侵微软获取用户电子邮件[J].保密科学技术,2019,0(4):71-71.
4毛秀珍,刘欢,唐倩.双因子模型MCAT中多级评分项目选题策略的比较[J].心理科学,2019,42(1):187-193. 被引量：1
5张伟,陈建峡,李超,黄煜俊,徐欣雨.输电线路故障分析多分类模型研究及应用[J].湖北工业大学学报,2019,34(2):5-9. 被引量：1
6王卫星,李斌.智慧校园用户身份特征多标签自适应分类仿真[J].计算机仿真,2019,36(2):149-152. 被引量：4
7谢安宁,张宏伟,赵志刚,孟智勇,王增国.基于三维旋转模型的红外全景图像拼接方法[J].激光与红外,2019,49(4):507-512. 被引量：10

北京工业大学学报

2019年第6期

浏览历史

内容加载中请稍等...

基于密度与距离的钓鱼邮件检测方法被引量：1

参考文献5

二级参考文献39

共引文献81

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于密度与距离的钓鱼邮件检测方法 被引量：1

参考文献5

二级参考文献39

共引文献81

同被引文献9

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于密度与距离的钓鱼邮件检测方法被引量：1