一种智能垃圾邮件过滤模型的仿真研究被引量：4

Simulation Study on Intelligent Model for Spam Filtering

下载PDF

导出

摘要研究垃圾邮件过滤准确率问题,电子邮件是一种高维、复杂的特殊文本,单一支持向量机、K近邻等传统模型均难以识别垃圾邮件,导致过滤正确率低。为了提高了垃圾邮件过滤正确率,提出一种K近邻和支持向量机相融合的垃圾邮件过滤模型(SVM-KNN)。首先将邮件特征向量输入到支持向量机学习,找到支持向量集,然后计算待识别邮件与最优超平面间的距离,距离大于阈值,便采用支持向量机识别邮件类型,否则用K近邻识别邮件类型。仿真结果表明,SVM-KNN很好地解决单一模型存在的难题,提高了垃圾邮件过滤正确率,是一种有效的电子邮件管理的手段。 Research on spam filtering accuracy problems. Email is a high-dimensional, complex special text, single support vector machine, K nearest neighbors and other traditional models are difficult to identify spam filter, so the accuracy is very low. In order to improve the spam filtering accuracy, this paper presented a spare filtering mod- el based on K neighbor and support vector machine （SVM-KNN）. Firstly, the mail feature vectors were input to a support vector machine to learn and find support vector set, and then the distance of recognition mail and the optimal hyper plane was calculated. If distance is greater than the threshold, support vector machine was used to identify the email type, otherwise K nearest neighbor was used to identify the email type. The simulation results show that the proposed model is a good solution for single model problems and improve the spam filtering accuracy, so SVM-KNN is an effective management means.

作者雷剑刚孙细斌

机构地区北京理工大学珠海学院

出处《计算机仿真》 CSCD 北大核心 2013年第5期370-373,407,共5页 Computer Simulation

关键词电子邮件垃圾邮件支持向量机近邻算法过滤 Email Spam Support vector machine （ SVM ） Nearest neighbor algorithm Filtering

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量：129
2李国明,汤文亮.反垃圾邮件技术及其最新展望[J].网络通讯与安全,2007,6(7):959-962.
3邱明明,吴国新.基于P2P的协作式垃圾邮件检测系统[J].计算机工程与设计,2007,28(11):2559-2562. 被引量：5
4张俊丽,张帆.改进KNN算法在垃圾邮件过滤中的应用[J].现代图书情报技术,2007(4):75-78. 被引量：14
5邹汉斌,雷红艳,邓卫红.支持向量机在反垃圾邮件过滤中的应用[J].计算机工程与设计,2007,28(9):2015-2017. 被引量：7
6李雯,刘培玉.基于贝叶斯的垃圾邮件过滤算法的研究[J].计算机工程与应用,2007,43(23):174-176. 被引量：14
7Mehra Sahami. Mining the Web to Determine Similarity Between Words [ C ]. Objects and Communities. FLAIRS Conference, 2006: 14-19.
8强永妍,杨庚.中文垃圾邮件的索引分词法的研究与设计[J].计算机应用,2007,27(9):2334-2336. 被引量：4
9闫鹏,郑雪峰,朱建勇,肖赟泓.一种基于嵌入式特征选择的垃圾邮件过滤模型[J].小型微型计算机系统,2009,30(8):1616-1620. 被引量：13
10洪艳,程克勤.基于电子邮件原理的垃圾邮件过滤策略[J].电脑知识与技术,2007(5):625-625. 被引量：1

二级参考文献84

1徐洪伟,方勇,音春.垃圾邮件过滤技术分析[J].通信技术,2003,36(10):126-128. 被引量：14
2李渝勤,孙丽华.基于规则的自动分类在文本分类中的应用[J].中文信息学报,2004,18(4):9-14. 被引量：20
3王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量：129
4刘华元,袁琴琴,王保保.并行数据挖掘算法综述[J].电子科技,2006,19(1):65-68. 被引量：15
5周文莉,吴晓非.P2P技术综述[J].计算机工程与设计,2006,27(1):76-79. 被引量：111
6张宏烈.支持向量机在字符识别中的应用研究[J].微计算机信息,2006(04Z):245-247. 被引量：11
7寇苏玲,蔡庆生.中文文本分类中的特征选择研究[J].计算机仿真,2007,24(3):289-291. 被引量：30
8张俊丽,张帆.改进KNN算法在垃圾邮件过滤中的应用[J].现代图书情报技术,2007(4):75-78. 被引量：14
9邹汉斌,雷红艳,邓卫红.支持向量机在反垃圾邮件过滤中的应用[J].计算机工程与设计,2007,28(9):2015-2017. 被引量：7
10李雯,刘培玉.基于贝叶斯的垃圾邮件过滤算法的研究[J].计算机工程与应用,2007,43(23):174-176. 被引量：14

共引文献166

1张登科,易秀双,王兴伟.一种基于相似度测量的新垃圾邮件发现机制[J].中国海洋大学学报（自然科学版）,2008,38(S1):147-150. 被引量：1
2刘洋,曹津宁,刘昊,秦玉平.基于贝叶斯方法的垃圾邮件处理模型研究[J].长春工程学院学报（自然科学版）,2007,8(3):75-76.
3王建玺,王刘涛.基于协同过滤的Multi-agent反垃圾邮件系统的研究[J].科技风,2009(16):180-181.
4张仁伟,王洪斌.一种基于行为检测的垃圾邮件过滤技术[J].哈尔滨职业技术学院学报,2008(4):123-125. 被引量：1
5张平.追求[J].就业与保障,2005(11):1-1.
6王金宝.基于增量学习和阈值优化的自适应信息过滤研究[J].计算机应用,2006,26(5):1099-1101.
7庄锁法,陈兴梅.客户端防范垃圾邮件策略的探讨[J].电脑知识与技术,2006(8):172-172.
8张洪军,段会川.基于支持向量机的电子邮件分类模型设计[J].信息技术与信息化,2006(5):89-90. 被引量：1
9徐卫.一种垃圾邮件过滤网关的设计[J].电脑知识与技术,2006(12):64-65.
10黄鹏鹤.垃圾邮件内容过滤测试平台的设计与实现[J].仪器仪表用户,2007,14(1):93-94.

同被引文献47

1李国明,汤文亮.反垃圾邮件技术及其最新展望[J].电脑知识与技术（过刊）,2007(16). 被引量：1
2邹磊,卢炎生,崔得暄,胡蓉.一种基于最小损失的垃圾邮件屏蔽算法[J].华中科技大学学报（自然科学版）,2005,33(z1):352-355. 被引量：2
3王潇杨,陈南飞,张登科,王兴伟.图片型垃圾邮件过滤分析系统设计和实现[J].大连理工大学学报,2011,51(S1):69-72. 被引量：3
4王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量：129
5戴劲松,白英彩.基于贝叶斯理论的垃圾邮件过滤技术[J].计算机应用与软件,2006,23(1):110-111. 被引量：16
6张泽明,罗文坚,王煦法.一种基于人工免疫的多层垃圾邮件过滤算法[J].电子学报,2006,34(9):1616-1620. 被引量：16
7张俊丽,张帆.改进KNN算法在垃圾邮件过滤中的应用[J].现代图书情报技术,2007(4):75-78. 被引量：14
8邹汉斌,雷红艳,邓卫红.支持向量机在反垃圾邮件过滤中的应用[J].计算机工程与设计,2007,28(9):2015-2017. 被引量：7
9卢苇,彭雅.几种常用文本分类算法性能比较与分析[J].湖南大学学报（自然科学版）,2007,34(6):67-69. 被引量：31
10向阳,王敏,马强.基于Jena的本体构建方法研究[J].计算机工程,2007,33(14):59-61. 被引量：34

引证文献4

1段鸿轩,赵凤芝.关于用户交互网站产品销售潜能预测仿真研究[J].计算机仿真,2015,32(11):441-444.
2王焱.自适应本体的垃圾邮件过滤实验设计[J].实验室研究与探索,2016,35(7):139-142.
3林荫.基于KNN-SVM的垃圾邮件过滤模型[J].现代电子技术,2016,39(23):90-92. 被引量：4
4王斌.基于朴素贝叶斯算法的垃圾邮件过滤系统的研究与实现[J].电子设计工程,2018,26(17):171-174. 被引量：9

二级引证文献13

1刘方园,王水花,张煜东.支持向量机模型与应用综述[J].计算机系统应用,2018,27(4):1-9. 被引量：73
2郝蓓,杨大利.基于改进KNN-SVM的车辆图像光照检测模型[J].计算机工程与应用,2017,53(24):207-212. 被引量：3
3邓金.基于自然语言处理技术的邮件检测系统[J].数字技术与应用,2019,37(6):117-118. 被引量：3
4任文.基于姿态估计的运动辅助训练系统研究[J].电子设计工程,2019,27(18):149-152. 被引量：4
5张源.基于朴素贝叶斯算法的Adult数据集分类研究[J].电子工程学院学报,2019,8(8):265-266. 被引量：1
6张源.基于朴素贝叶斯算法的Adult数据集分类研究[J].科技成果纵横,2019,28(19):28-30.
7李子乾.云计算中垃圾邮件识别的机器学习算法[J].自动化技术与应用,2020,39(5):88-95.
8朱昊,顾天一,董宁,王勇,梁满志.疫情防控工作中敏感邮件智能过滤方法研究[J].现代计算机,2020,26(19):30-34.
9余石龙,鲍劲松,李婕,张启华.基于误差注意力的晶圆制造数据异常检测[J].中国机械工程,2020,31(14):1686-1692. 被引量：2
10盖璇.基于聚类分析算法的垃圾邮件识别[J].计算机与现代化,2020(10):17-22. 被引量：3

1蒋亚平,梅骁.基于支持向量机与人工免疫系统的垃圾邮件过滤模型[J].现代计算机（中旬刊）,2016(4):55-57. 被引量：1
2杨静丽,夏跃伟.基于主题划分的P2P垃圾邮件过滤模型[J].武汉理工大学学报,2008,30(8):43-45. 被引量：1
3杨震,范科峰,雷建军.隐私保护的自适应垃圾邮件过滤方法研究[J].通信学报,2009,30(S1):145-149. 被引量：2
4艾宏山.Pro／E中特殊文本的输入[J].舰船光学,2004,40(2):46-48.
5吴叶科,邬颖捷,宋如顺,陈波.粗LVQ神经网络的垃圾邮件过滤[J].计算机工程与应用,2011,47(26):107-109.
6任贤.一种多算法协作式垃圾邮件过滤模型[J].科技信息,2011(16).
7白勇峰,任小康.基于粗糙集与SVM的图像检索相关反馈算法[J].佳木斯大学学报（自然科学版）,2010,28(2):187-189.
8奉国和.边界K邻近大样本支持向量机分类[J].计算机工程与应用,2009,45(23):15-17. 被引量：2
9田新梅,吴秀清,刘莉.大样本情况下的一种新的SVM迭代算法[J].计算机工程,2007,33(8):205-207. 被引量：4
10花小朋,皋军,田明,刘其明.改进的SVDD增量学习算法[J].计算机工程,2009,35(22):210-211. 被引量：6

计算机仿真

2013年第5期

浏览历史

内容加载中请稍等...

一种智能垃圾邮件过滤模型的仿真研究被引量：4

参考文献11

二级参考文献84

共引文献166

同被引文献47

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一种智能垃圾邮件过滤模型的仿真研究 被引量：4

参考文献11

二级参考文献84

共引文献166

同被引文献47

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一种智能垃圾邮件过滤模型的仿真研究被引量：4