期刊文献+

基于SMO和指纹技术在线邮件过滤方法与优化 被引量:1

Online Filtering Method and Optimization Based on SMO and E-mail Fingerprint
下载PDF
导出
摘要 研究了垃圾邮件的指纹特征向量表示和SVM过滤方法,设计实现了基于指纹特征和SMO的在线式邮件过滤器FSVM,在在线垃圾信息过滤上获得到了与传统方法相当的效果.在SVM过滤的运算速度方面,基于原始SMO算法,对上述在线方法提出了邮件样本动态集方法(DFSVM)进行条件减弱,在降低了计算量的同时能够保证指纹SMO获得相当的过滤效果.在标准测试集和真实邮件系统中进行了实验验证和对比,结果表明,该改进对提高SVM分类精读有一定的帮助. The finger features vectoring and the SVM filtering method are proposed on the spam,and an online SVM spam filter called FSVM is designed and implemented,which attains the corresponding performance as the classic method in the online spam filtering.In view of the computing speed of SVM filtering,a dynamic example set reduction method(DFSVM) is given out for SVM filtering method based on the original SMO algorithm,which can greatly reduce the computing cost and keep the corresponding performance.The experime...
出处 《郑州大学学报(理学版)》 CAS 北大核心 2009年第1期90-93,98,共5页 Journal of Zhengzhou University:Natural Science Edition
关键词 垃圾邮件过滤 支持向量机 条件减弱 动态子集 spam filtering SVM conditional relax dynamic subset
  • 相关文献

参考文献2

二级参考文献3

  • 1Amari S,Neural Networks,1999年,12卷,783页
  • 2Therson Joachims.Text Categorization with Support Vector Machines:Learning with Many Relevant Features[].European Conference on Machine Learning(ECML).1998
  • 3V.Vapnik.The nature of Statistical Learning Theory[]..1995

共引文献79

同被引文献12

  • 1金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量:80
  • 2王斌,潘文锋.基于内容的垃圾邮件过滤技术综述[J].中文信息学报,2005,19(5):1-10. 被引量:129
  • 3彭京,杨冬青,唐世渭,付艳,蒋汉奎.一种基于语义内积空间模型的文本聚类算法[J].计算机学报,2007,30(8):1354-1363. 被引量:44
  • 4LIU Qun,LI Su-jian. Word similarity computing based on How-Net[J]. Computational Lingustics and Chinese Lan- guage Processing, 2002,7 (2) : 59-76.
  • 5NEEDLEMAN S B,WUNSCH C D. A general method applicable to the search for similarities in the amino acid se- quence of two proteins[J]. J Mol Bio1,1970,48(3):443-453.
  • 6NAVARRO G ,RAFFINOT M. Flexible pattern matching in stirngs :practical on-line search algorithms for texts and biological sequences[M]. Cambridge :Cambridge University Press ,2002 : 132-137.
  • 7HAN Jia-wei,KAMBER M. Data mining: concept s and techniques[M]. 2nd ed. San Francisco :Morgan Kau[mann Publishers, 2006 : 263-265.
  • 8潘文峰.[D].北京.中国科学院计算技术研究所,2004.7.
  • 9Tan Pang-Ning,Steinbach M,Kumar V.数据挖掘导论[M].范明,范宏建译.北京:人民邮电出版社,2006.
  • 10施展,李郝林.实验数据聚类有效性的评价及其应用[J].模式识别与人工智能,1997,10(2):184-188. 被引量:7

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部