摘要
为提高垃圾邮件检测精度,提出一种基于ECVM的Tri-training半监督垃圾邮件检测算法,兼顾了Tri-training算法的准确性和ECVM算法处理大规模数据的高效性特点,可以降低算法的时间和空间复杂度,提高未标记数据的利用率,适应垃圾邮件数据的规模大、标记数据少、稀疏性强等特点。Matlab实验表明Tri-training+ECVM比传统的Tri-training+SVM在准确率和时间复杂度指标上都有大幅度的提升。
出处
《宿州学院学报》
2016年第8期105-107,117,共4页
Journal of Suzhou University
基金
安徽省教育厅自然科学研究重点项目"基于deepweb数据集成的企业情报个性化推送系统"(KJ2012A205)
安徽省教育厅自然科学研究重点项目"半监督冗余特征检测技术"(KJ2016A502)
巢湖学院"计算机图形学"课程开发项目(ch15yykc05)