摘要
不良信息特征项的挖掘精度制约着不良信息鉴别与过滤的效果。文章从数据挖掘的角度对不良信息特征项的识别进行研究,提出了一种自动高效地挖掘文档潜在特征项的新方法:首先对文档进行必要的预处理,包括自动分词、无用项过滤、项标引以及项的分箱操作等,然后利用数据挖掘中的关联分析技术识别文档中的特征项。试验结果验证了该方法的可行性。
The paper presents a novel data mining method to automatically identify
出处
《计算机工程与应用》
CSCD
北大核心
2003年第28期39-41,共3页
Computer Engineering and Applications
基金
天津自然科学基金资助(编号:023601411)
关键词
信息过滤
不良信息
特征项
关联分析
in Chinese documents.Firstly,it needs the Chinese documents to be pre -processed.Secondly,data mining technology will be used to mine strong association rules,which can acquire feature words of the document.The experiment shows that a system