期刊文献+

基于示例的中文文本过滤模型 被引量:13

Example-based Chinese text filtering model
下载PDF
导出
摘要 简要描述了文本过滤的背景 ,提出了基于示例的中文文本过滤模型 .其基本思想是首先对于用户提出的示例文本进行文本结构分析 ,采用文本层次分析方法 ,提取文本特征 ,形成主题词表示的用户模板 ,然后进行文本过滤 .在用户反馈的基础上 ,扩充示例文本数量 ,进而采用基于潜在语义标注的文本过滤方法 ,改进用户模板 ,提高过滤效率 . This paper briefly describes the background of text filtering and puts forward examplebased Chinese text filtering model. The basic ideas of the model are as follows: it analyzes the structure of the texts, applies the text hierarchical analysis approach presented in this paper to extract the from the texts, forms the user profiles consisting of the above and then filters the new text sources . Consequently, based on the user feedback, it expands the number of examplebased texts, applies the approach of latent semantic indexing to filter texts, and updates the user profiles to improve the efficiency of filtering model
出处 《大连理工大学学报》 CAS CSCD 北大核心 2000年第3期375-378,共4页 Journal of Dalian University of Technology
关键词 广西结构 潜在语义索引 中文文本过滤模型 TREC semantic information/text filtering text structure analysis latent semantic indexing
  • 相关文献

参考文献4

二级参考文献8

  • 1江红,吴立德,沙新时.机器翻译系统中概念词典的设计与实现[J].计算机研究与发展,1995,32(3):13-18. 被引量:4
  • 2靳从,樊春丽,杨静宇.主题词自动标引中的知识处理方法[J].情报理论与实践,1996,19(2):30-33. 被引量:3
  • 3吴立德,Int Symp on Natural Language Generation and the Processing of thd Chinese Language,1996年
  • 4刘开瑛,自然语言处理,1991年
  • 5冯志纯,新编汉语多功能词典,1989年
  • 6梅家驹,同义词词体,1983年
  • 7刘开瑛,计算机期刊关键词标引统计分析技术报告,1996年
  • 8刘开瑛,中国人民银行××省分行《重要文件汇编》的主题词标引研究技术报告,1996年

共引文献46

同被引文献62

  • 1陈群秀.一个在线义类词库:词网 WordNet[J].语言文字应用,1998(2):95-101. 被引量:31
  • 2焦李成,保铮.进化计算与遗传算法──计算智能的新方向[J].系统工程与电子技术,1995,17(6):20-32. 被引量:23
  • 3张全力,何卫平,秦忠宝,王政.基于样本公共特征的产品设计信息搜集[J].计算机工程,2006,32(3):209-211. 被引量:1
  • 4余力,董斯维,郭斌.电子商务推荐攻击研究[J].计算机科学,2007,34(5):134-138. 被引量:11
  • 5刘振华 尹萍.信息隐蔽技术及其应用[M].北京:科学出版社,2002..
  • 6黄萱菁 夏迎炬 吴立德.基于向量空间模型的文本过滤系统【C】..见:中国中文信息学会二十周年学术会议[C].,2001-11.12-13.
  • 7D W Oard, et al. A Conceptual Framework for Text Filtering,University of Maryland [ R ]. Technical Report EE-TR-96-25CAR- TR- 830CLIS-TR-96-02 CS-TR- 3643,1996.
  • 8S Roberton, D Hull.The TREC-9 Filtering Track Final Report[C] .Proceeding of the Ninth Text Retrieval Conference(TREC-9) ,2001.
  • 9J Morris, G Hirst. I_exical Cohesion Computed by Thesaural relations as an Indicator of the Structure of Text [ J ].Computational Linguistics, 1991,17( 1 ) : 21-48.
  • 10Stairmand M A. A Computational Analysis of Izxical Cohesion with Apphcations in Information Retrieval [ D ]. PhD Tnesis,DeparUnent of Iangu # Engneering. University of Manchester Institute of Science and Technology, 1996.

引证文献13

二级引证文献93

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部