-
题名距离函数分类法在垃圾邮件过滤中的应用
被引量:1
- 1
-
-
作者
林琛
李弼程
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2007年第2期322-323,447,共3页
-
基金
河南省教育厅基金项目(sp200303099)
-
文摘
为了得到实用性强的垃圾邮件过滤方法,将距离函数分类法首次引入到垃圾邮件过滤中。在通用邮件语料库上进行测试,并与目前过滤性能较好的KNN算法进行比较,实验结果显示距离函数分类法中的类中心向量法不适合用于垃圾邮件的过滤,而类重心向量法在保持较高过滤性能的同时,具有训练和过滤速度快的优点,是一种理想实用的垃圾邮件过滤方法。
-
关键词
垃圾邮件
分类
距离函数
类重心向量
垃圾邮件过滤
-
Keywords
spain, categorization
distance function
category centroid
spam filtering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于信息粒度原理的垃圾邮件过滤方法
被引量:2
- 2
-
-
作者
盛亮
李弼程
林琛
-
机构
信息工程大学信息工程学院
-
出处
《信息工程大学学报》
2007年第1期15-17,52,共4页
-
文摘
信息粒度原理是一种从多个角度来精确描述对象的物理学方法。本文将信息粒度的原理应用到垃圾邮件的过滤中,提出了一种基于信息粒度原理的垃圾邮件过滤方法。通过对原始样本空间更精细的划分来实现对邮件类别的更准确描述。本文在Ling-Spam语料库上进行了试验,结果表明,新方法具有较高的分类精度和良好的处理速度。
-
关键词
信息粒度
垃圾邮件过滤
类重心向量
-
Keywords
information granularity
spam filtering
category centroid vector
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-