期刊文献+

用关联分析技术识别不良信息特征项的新方法 被引量:6

A New Method to Identify Keywords in Chinese Documents Using Association Analyzing Technology
下载PDF
导出
摘要 不良信息特征项的挖掘精度制约着不良信息鉴别与过滤的效果。文章从数据挖掘的角度对不良信息特征项的识别进行研究,提出了一种自动高效地挖掘文档潜在特征项的新方法:首先对文档进行必要的预处理,包括自动分词、无用项过滤、项标引以及项的分箱操作等,然后利用数据挖掘中的关联分析技术识别文档中的特征项。试验结果验证了该方法的可行性。 The paper presents a novel data mining method to automatically identify
出处 《计算机工程与应用》 CSCD 北大核心 2003年第28期39-41,共3页 Computer Engineering and Applications
基金 天津自然科学基金资助(编号:023601411)
关键词 信息过滤 不良信息 特征项 关联分析 in Chinese documents.Firstly,it needs the Chinese documents to be pre -processed.Secondly,data mining technology will be used to mine strong association rules,which can acquire feature words of the document.The experiment shows that a system
  • 相关文献

参考文献5

  • 1李晓黎,刘继敏,史忠植.概念推理网及其在文本分类中的应用[J].计算机研究与发展,2000,37(9):1032-1038. 被引量:57
  • 2刘斐.[D].山东工业大学,1999.
  • 3Laurence A F Park et al.Internet Document Filtering Using Fourier Domain Scoring[J].PKDD 2001,LNAI 2168;2001.
  • 4David Gilbert ,Michael Schroeder.FURY:Fuzzy unification and resolution based on edit distance[C].In:International Conference on Bioinformatics and Biomedical Egineering,IEEE,2000.
  • 5刘斐.[D].山东工业大学,1999.

二级参考文献5

  • 1史忠植,高级人工智能,1998年,206页
  • 2陆汝钤,人工智能,1996年
  • 3Lang K,Int’ l Conf on Machine Learning ( ICML ),1995年,331页
  • 4Yang Y,Proc of the Seven-teenth Int’ l ACM SIGIR Conf on Research and Development in I,1994年,13页
  • 5石纯一,人工智能原理,1993年

共引文献56

同被引文献71

引证文献6

二级引证文献63

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部