改进的一分类支持向量机的邮件过滤研究被引量：2

Filtering e-mail based on improved One-class Support Vector Machine

下载PDF

导出

摘要服务器端存在多个用户,且人们对邮件内容的理解和认可程度不同,因此邮件过滤中涉及到不确定信息的处理。就邮件内容来看,邮件过滤通常涉及到隐私,不利于大量收集样本并评价打分。因此提出了一种基于改进的一分类支持向量机的邮件过滤方法。该方法优点在于:(1)用户只需为不确定性很强的待区分邮件给出隶属度;(2)只需收集和训练一类邮件样本,便可以建立邮件分类模型;(3)把隶属度首次引入到1-SVM中,并且由隶属度的值的大小来确定惩罚因子的值。通过仿真实验验证了该方法的有效性。 Because there are many users in server,and users have different understand or admitting degrees for the content of e-mails,uncertain information processing is dealt with in filtering e-mails.From the content of e-mails point of view,filtering e-mails always deals with privacy,this is disadvantage for largely collecting e-mails and evaluating them.Filtering e-mail based on improved one-class SVM is proposed,the advantages of the method are（1）users only give membership degrees for uncertain e-mails which will be dealt with;（2）classing e-mails model is constructed by a kind of e-mail samples;（3）membership degrees are discussed in one-class SVM,and membership degrees are also used to decide punish factors.Simulation shows that the method is effective.

作者秦谊裴峥杨霁琳

机构地区西华大学数学与计算机学院西南交通大学数学学院

出处《计算机工程与应用》 CSCD 北大核心 2009年第20期151-153,168,共4页 Computer Engineering and Applications

基金四川省重大科技专项项目(No.2008GZ0118) 四川省杰出青年基金(No.06ZQ026-037)

关键词一分类支持向量机邮件过滤隶属度不确定性有序加权平均算子 One-class Support Vector Machine （1-SVM） e-mail filtering membership degree uncertainty Ordered Weighted Avcraging（OWA） operator

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量：129
2杨霁琳,彭宏,邓爽,赵毓高.基于OWA算子与FSVM的邮件过滤[J].计算机工程,2007,33(20):61-63. 被引量：2
3路梅,叶澄清.协同分类器及其在邮件过滤中的应用[J].计算机工程与应用,2008,44(4):135-137. 被引量：1

二级参考文献54

1李渝勤,孙丽华.基于规则的自动分类在文本分类中的应用[J].中文信息学报,2004,18(4):9-14. 被引量：20
2王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量：129
3南丽丽.垃圾邮件过滤方法浅析[J].运城学院学报,2005,23(5):60-61. 被引量：3
4M. DeSouza, J. Fitzgerald, C. Kempand G. Truong, A Decision Tree based Spam Filtering Agent[EB] . from http:∥www. cs. mu. oz. au/481/2001- projects/gntr/index. html, 2001.
5N. Littlestone, Learning quickly when irrelevant attributes abound: A new linear-threshold algorithm[J]. Machine Learning, 2(4) :285- 318, 1988[J].
6R. Krishnamurthy and C. Orasan, A corpus-based investigation of junk emails[A]. In: Proceedings of Language Resources and Evaluation Conference (LREC 2002)[C]. Las Palmas de Gran Canaria, Spain, pp. 1773- 1780,May 2002.
7M. Sahami, S. Dumais, D. Heckerman and E. Horvitz, A Bayesian approach to filtering junk e-mail[A]. In:Proc. of AAAI Workshop on Learning for Text Categorization[C]. pp. 55-62, 1998.
8W. Cohen, Fast effective rule induction[A]. In: Machine Learning Proceedings of the Twelfth International Conference[C]. Lake Taho, California, Mongan Kanfmann, pp. 115-123, 1995.
9W. Cohen, Learning rules that classify email[A]. In: Proceedings of the AAAI spring symposium of Machine Learning in Information Access, Palo Alto[C]. California, pp. 18 - 25. 1996.
10X. Carreras and L. Marquez, Boosting Trees for Anti-Spam Email Filtering[A]. In: Proceedings of Euro Conference Recent Advances in NLP (RANLP-2001)[C]. pp. 58-64, Sep. 2001.

共引文献129

1张登科,易秀双,王兴伟.一种基于相似度测量的新垃圾邮件发现机制[J].中国海洋大学学报（自然科学版）,2008,38(S1):147-150. 被引量：1
2刘洋,曹津宁,刘昊,秦玉平.基于贝叶斯方法的垃圾邮件处理模型研究[J].长春工程学院学报（自然科学版）,2007,8(3):75-76.
3张平.追求[J].就业与保障,2005(11):1-1.
4王金宝.基于增量学习和阈值优化的自适应信息过滤研究[J].计算机应用,2006,26(5):1099-1101.
5庄锁法,陈兴梅.客户端防范垃圾邮件策略的探讨[J].电脑知识与技术,2006(8):172-172.
6张洪军,段会川.基于支持向量机的电子邮件分类模型设计[J].信息技术与信息化,2006(5):89-90. 被引量：1
7徐卫.一种垃圾邮件过滤网关的设计[J].电脑知识与技术,2006(12):64-65.
8黄鹏鹤.垃圾邮件内容过滤测试平台的设计与实现[J].仪器仪表用户,2007,14(1):93-94.
9陈超,陈盛雄.一种基于SMO算法的垃圾邮件过滤系统设计[J].福建电脑,2007,23(3):131-132. 被引量：1
10张俊丽,张帆.改进KNN算法在垃圾邮件过滤中的应用[J].现代图书情报技术,2007(4):75-78. 被引量：14

同被引文献6

1Drucker H, Wu D, Vapnik V. Support Vector Machines for spam categorization [ J ]. IEEE Transactions on Neural Networks, 1999,10: 1048 - 1054.
2中国教育和科研网紧急响应组(CCERT)[Z].http://www.ccert.edu.cn/spam/sa/datasets.htm,2010,2.
3金展,范晶,陈峰,徐从富.基于朴素贝叶斯和支持向量机的自适应垃圾短信过滤系统[J].计算机应用,2008,28(3):714-718. 被引量：17
4王祖辉,姜维.基于支持向量机的垃圾邮件过滤方法[J].计算机工程,2009,35(13):188-189. 被引量：7
5裴峥.模糊诱导有序加权平均算子[J].西华大学学报（自然科学版）,2012,31(1):22-26. 被引量：1
6安金龙,王正欧,马振平.一种新的支持向量机多类分类方法[J].信息与控制,2004,33(3):262-267. 被引量：46

引证文献2

1王强,贾银山.支持向量机及其在邮件过滤中的应用[J].微处理机,2010,31(3):43-45.
2张雪征,裴峥.模糊诱导有序加权平均算子的散度[J].西华大学学报（自然科学版）,2012,31(2):5-8.

1神经网络与其它计算机理论及技术[J].电子科技文摘,2006(2):114-115.
2郑玮.基于相对密度的加权一分类支持向量机[J].淮阴师范学院学报（自然科学版）,2016,15(4):317-322. 被引量：1
3刘敬,谷利泽,钮心忻,杨义先.基于单分类支持向量机和主动学习的网络异常检测研究[J].通信学报,2015,36(11):136-146. 被引量：32
4吴疆.单分类支持向量机在样本数目失衡分类问题中的应用[J].现代企业教育,2011,0(A11):290-290. 被引量：1
5肖仙谦,朱俊平,景旭,马巧娥.基于贝叶斯方法的单分类入侵检测技术[J].河北大学学报（自然科学版）,2014,34(1):7-13.
6王德文,赵文清,朱永利.一个基于粗糙集理论的邮件分类模型[J].计算机工程与应用,2006,42(18):167-170. 被引量：5
7胡骏.支持向量机理论探讨[J].科技创业月刊,2012,25(3):106-108. 被引量：1
8李贯峰,刘平,李萍.基于OWA算子的不确定模式匹配方法组合研究[J].计算机应用与软件,2013,30(12):181-184. 被引量：2
9李闯,端木京顺,雷英杰,高建国.基于认知图和直觉模糊推理的态势评估方法[J].系统工程与电子技术,2012,34(10):2064-2068. 被引量：13
10孙德山,吴今培.基于线性规划的多类支持向量机算法[J].计算机科学,2005,32(10):160-163. 被引量：5

计算机工程与应用

2009年第20期

浏览历史

内容加载中请稍等...

改进的一分类支持向量机的邮件过滤研究被引量：2

参考文献3

二级参考文献54

共引文献129

同被引文献6

引证文献2

相关作者

相关机构

相关主题

浏览历史

改进的一分类支持向量机的邮件过滤研究 被引量：2

参考文献3

二级参考文献54

共引文献129

同被引文献6

引证文献2

相关作者

相关机构

相关主题

浏览历史

改进的一分类支持向量机的邮件过滤研究被引量：2