期刊文献+

基于频繁项集挖掘的正例文本提取方法

Method of Positive-example Text Extraction Based on Frequent Itemset Mining
下载PDF
导出
摘要 提取合适的正例文本是生成有效过滤模板的重要基础。通常采用的人工评测方法的显著缺点是无法准确判断文本内容并选择切实相关的文本,所以本文在频繁项集挖掘的基础上提出了一种判断给定文本是否相关并提取合适正例文本的方法。实验结果证实了该方法的有效性。 It is the important groundwork for constructing an effective filtering profile to extract right positive - example text. The method of Manual evaluating used usually can not distinguish the contents of texts and vote in correlative texts well, so this paper brings forward a method for distinguishing the contents of texts and voting in correlative texts well based on frequent itemset mining. The result of experiments proves its effect.
作者 朱祥玉
出处 《信息技术与信息化》 2008年第3期41-43,共3页 Information Technology and Informatization
关键词 过滤模板 正例文本 频繁项集 TF—RIApriori算法 Filtering profile Positive - example text Frequent itemset TF - RIApriori algorithm
  • 相关文献

参考文献8

二级参考文献26

  • 1赵林,胡恬,黄萱菁,吴立德.基于知网的概念特征抽取方法[J].通信学报,2004,25(7):46-54. 被引量:17
  • 2黄钢石 ,张亚非 ,陆建江 ,肖江 .基于NMF的用户模板构造方法[J].情报学报,2004,23(4):394-398. 被引量:2
  • 3张鹏飞,李赟,刘建毅,钟义信.基于相对词频的文本特征抽取方法[J].计算机应用研究,2005,22(4):23-26. 被引量:9
  • 4(美)希德曼 刘艺译.SQL Serve r2000数据挖掘技术指南[M].北京:清华大学出版社,2000-02..
  • 5范明 孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版社,2002..
  • 6Yang Y,http://citeseernjneccom/yang97comparativehtml,1997年
  • 7Lewis DD, Feature Selection and Feature Extraction for Text Categorization [ A ]. Proceedings of Speech and Natural Language Workshop[ C]. San Francsico: Morgan Kaufmann,1992. 212-217.
  • 8Mladenic D, Grobelnik M, Feature Selection for Unbalanced Class Distribution and Native Bayes [ EB/OL ]. http://www-2, cs. cmu.edu/afs/cs/ project/theo- 4/text -learning/www/, 2000-03/2004-04.
  • 9Yang Y, Pedersen J O. A Comparative Study on Feature Selection in Text Categorization [ EB/OL ]. http://citeseer, nj. nec. com/yang97comparative, html, 1997/2004-04.
  • 10秦兵 郑实福 刘挺.基于改进的贝叶斯模型的中文网页分类器,自然语言理解与机器翻译[M].北京:清华大学出版社,2000.373-378.

共引文献139

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部