-
题名基于动态特征库的电子邮件分类的研究
- 1
-
-
作者
穆俊鹏
董魁锋
张明
-
机构
上海出版印刷高等专科学校
上海海事大学信息工程学院
-
出处
《计算机与现代化》
2012年第7期120-123,共4页
-
基金
上海海事大学科研基金资助项目(20100091)
-
文摘
随着邮件分类技术的不断发展,为了对邮件进行更加有效的组织和管理,需要对不断变化的邮件进行动态特征提取,根据其动态特征对邮件进行分类。从邮件的动态特征方面入手,通过编写邮件客户端程序,利用中科院的ICTCLAS分词工具实现中文邮件的准确分词,利用改进的TF-IDF算法对邮件的特征权重进行计算,并利用WEKA挖掘工具进行结果的仿真实验。实验结果表明,利用邮件的动态特征来对邮件进行分类是切实可行的,且在一定程度上能够对邮件进行合理有效的分类。
-
关键词
动态特征
邮件分类
中文分词
TF-IDF
WEKA
数据挖掘
-
Keywords
dynamic characteristics
mail classification
Chinese word segmentation
TF-IDF
WEKA
data mining
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP393
[自动化与计算机技术—计算机应用技术]
-