基于Winnow的中文邮件分类器的设计
Design of the Chinese Mail Classifier Based on Winniw
摘要
首先通过建立实验用中文邮件语料库,提出了用Winnow算法实现邮件分类器,并讨论了其特点.然后,提出了通过建立分类规则库改善邮件分类器的分类效果.实验证明,该方法能有效提高邮件分类的可信度.
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2005年第z1期807-812,共6页
Journal of Nanjing University(Natural Science)
基金
江苏省高技术研究项目(BG2005020),江苏省教育厅自然基金(04KKB320134)
参考文献9
-
1[1]http://www. iit. demokritos. gr/skel/i-config/downloads/.
-
2[2]中国图书馆分类法.第四版.北京图书馆出版社,1999
-
3[3]Jake D B, Christopher Meek. Challenges of the Email Domain for Text Classification. Proceedings of the Seventeenth International Conference on Machine Learning,2000,103~110.
-
4[4]Fabrizio S. Machine Learning in Automted Text Categorization. ACM computing surveys, 2002,34(1).
-
5[5]Kjersti A, Line E. Text Categorisation: A Survey,1999.
-
6[7]http://popfile. sourceforge. net/.
-
7[8]http://fox. foxmail. com. cn/.
-
8[9]www. vad. com. cn/work/educationalresource/nostandardcourse/1/26/index535. htm.
-
9[10]Nick L. Learning Quickly When Irrelevant Attributes Abound: A New Linear-threshold Algorithm, 1987.
-
1朱巧明,周志军,李培峰.基于Winnow的中文邮件分类器的设计[J].电子学报,2005,33(B12):2481-2484.
-
2浦海晨,万晓冬.一种基于文本分类技术的邮件过滤系统设计[J].福建电脑,2005,21(11):97-98.
-
3浦海晨,万晓冬.一种基于文本分类技术的邮件过滤系统设计[J].科技广场,2005(6):21-24.
-
4徐海涛,杨森,柴乔林.中文邮件分类器的设计与实现[J].计算机应用,2003,23(z2):166-169. 被引量:1
-
5陈杰,陈熙霖,高文.基于遗传算法重采样的人脸样本扩张[J].软件学报,2005,16(11):1894-1901. 被引量:8
-
6姚学礼.基于内容过滤垃圾邮件综述[J].科技风,2009(11).
-
7王明璐.改进的神经网络算法在垃圾邮件过滤中的应用[J].信息技术,2015,39(8):174-178.
-
8李军辉,朱巧明,李培峰.基于邮件过滤的中文邮件语料库构建[J].计算机应用与软件,2007,24(8):56-58. 被引量:3
-
9王新梅,卢苇,尹朝庆,吕亚兵.基于文本挖掘的邮件分类与过滤[J].计算机工程与应用,2006,42(2):135-137. 被引量:6
-
10熊忠阳,杜圣东,张玉芳.一种改进的支持向量机邮件分类器[J].计算机科学,2007,34(9):90-92. 被引量:2