期刊文献+

基于文本分类技术的垃圾邮件识别系统 被引量:10

A Recognition System of Spam Based on Text Classification Technology
下载PDF
导出
摘要 文章介绍了一个基于文本分类技术识别垃圾邮件系统的体系结构,并介绍了该系统涉及到的中文信息处理、文本特征选取、朴素贝叶斯分类器等关键技术。最后,文章给出了针对部分垃圾邮件的处理结果。结果表明,该方法对于垃圾邮件的识别,具有较好的效果。 This paper mainly describes the architecture of the recognition system of spam based on text classification technology. In addition, some related key technologies, such as Chinese information processing, text characteristic choicing and classifier of native Bayes are introduced. Finally, this paper provide the result of the processing on part of Spam. It shows that this method is quite useful for identifying mail Spam.
作者 李国栋 李卫
出处 《微电子学与计算机》 CSCD 北大核心 2004年第6期145-146,193,共3页 Microelectronics & Computer
基金 国家自然科学基金项目(59937150) 国家863计划项目(2001AA413910)
关键词 垃圾邮件 文本分类 汉语切词 朴素贝叶斯 Spam, Text Classification, Word Segmentation of Chinese, Native Bayes
  • 相关文献

参考文献6

  • 1中国互联网协会.中国互联网协会反垃圾邮件规范[Z].,2003..
  • 2国家标准GB13715.信息处理用现代汉语分词规范.北京:中国标准出版社,1992.
  • 3冯志伟.确定切词单位的某些语法因素.Journal of Chinese Language and Computer,Singapore[Z].,2001..
  • 4.RFC822,RFC1341,RFC2045等MIME相关规范.[S].,..
  • 5Jiawei Han,Micheline Kamber.数据挖掘-概念与技术.高等教育出版社,2001.5.
  • 6G F Cooper and E Herskovtis. A Bayesian method for the induction of probabilistic network from data. Machine Learning, 1992,10.

共引文献1

同被引文献74

引证文献10

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部