摘要
引入柯尔莫格洛夫复杂性理论来描述邮件的特征,采用信息距离理论衡量邮件的相似程度,采用支持向量机(SVM)算法对邮件进行分类,提出了一种高准确率的垃圾邮件识别方法.相对于传统的垃圾邮件识别方法,该方法不需要对垃圾邮件进行邮件分割,省略邮件头分析和正文分析,可以准确地刻画垃圾邮件的主要特征,具有运算简单高效的特点.测试结果表明:该方法对文本邮件的分类准确率高达99%以上,有效提高了垃圾邮件识别的准确率.
引入柯尔莫格洛夫复杂性理论来描述邮件的特征,采用信息距离理论衡量邮件的相似程度,采用支持向量机(SVM)算法对邮件进行分类,提出了一种高准确率的垃圾邮件识别方法.相对于传统的垃圾邮件识别方法,该方法不需要对垃圾邮件进行邮件分割,省略邮件头分析和正文分析,可以准确地刻画垃圾邮件的主要特征,具有运算简单高效的特点.测试结果表明:该方法对文本邮件的分类准确率高达99%以上,有效提高了垃圾邮件识别的准确率.
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第S2期287-290,共4页
Journal of Huazhong University of Science and Technology(Natural Science Edition)
基金
中央高校基本科研业务费专项资金资助项目(YWF1003H026
YWF1103Q009)
高等学校博士学科点专项科研基金资助项目(20091102110004)