基于示例的中文文本过滤模型被引量：13

Example-based Chinese text filtering model

下载PDF

导出

摘要简要描述了文本过滤的背景 ,提出了基于示例的中文文本过滤模型 .其基本思想是首先对于用户提出的示例文本进行文本结构分析 ,采用文本层次分析方法 ,提取文本特征 ,形成主题词表示的用户模板 ,然后进行文本过滤 .在用户反馈的基础上 ,扩充示例文本数量 ,进而采用基于潜在语义标注的文本过滤方法 ,改进用户模板 ,提高过滤效率 . This paper briefly describes the background of text filtering and puts forward examplebased Chinese text filtering model. The basic ideas of the model are as follows: it analyzes the structure of the texts, applies the text hierarchical analysis approach presented in this paper to extract the from the texts, forms the user profiles consisting of the above and then filters the new text sources . Consequently, based on the user feedback, it expands the number of examplebased texts, applies the approach of latent semantic indexing to filter texts, and updates the user profiles to improve the efficiency of filtering model

作者林鸿飞姚天顺

机构地区大连理工大学计算机科学与工程系东北大学计算机科学与工程系

出处《大连理工大学学报》 CAS CSCD 北大核心 2000年第3期375-378,共4页 Journal of Dalian University of Technology

关键词广西结构潜在语义索引中文文本过滤模型 TREC semantic information/text filtering text structure analysis latent semantic indexing

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1刘开瑛,薛翠芳,郑家恒,周晓强.中文文本中抽取特征信息的区域与技术[J].中文信息学报,1998,12(2):1-7. 被引量：45
2韦雄观,吴立德,王文欣.基于关系图的篇章分析方法[J].模式识别与人工智能,1997,10(2):112-117. 被引量：5
3吴立德，大规模中文文本处理，1997年
4姚天顺，自然语言理解，1995年

二级参考文献8

1江红,吴立德,沙新时.机器翻译系统中概念词典的设计与实现[J].计算机研究与发展,1995,32(3):13-18. 被引量：4
2靳从,樊春丽,杨静宇.主题词自动标引中的知识处理方法[J].情报理论与实践,1996,19(2):30-33. 被引量：3
3吴立德，Int Symp on Natural Language Generation and the Processing of thd Chinese Language，1996年
4刘开瑛，自然语言处理，1991年
5冯志纯，新编汉语多功能词典，1989年
6梅家驹，同义词词体，1983年
7刘开瑛，计算机期刊关键词标引统计分析技术报告，1996年
8刘开瑛，中国人民银行××省分行《重要文件汇编》的主题词标引研究技术报告，1996年

共引文献46

1谢春发.中文信息处理在智能答疑系统中的应用研究[J].福建广播电视大学学报,2005(2):55-57.
2刘海峰,王元元,王倩.基于位置和类别结合模式的一种文本自动分类模型[J].图书情报工作,2006,50(S2):90-92.
3何静,刘海燕.基于向量空间模型的实时内容过滤[J].计算机工程,2004,30(15):26-27. 被引量：2
4郑海,林鸿飞.基于段落匹配的文本分类机制[J].计算机工程与应用,2004,40(28):174-176. 被引量：3
5温有奎.基于“知识元”的知识组织与检索[J].计算机工程与应用,2005,41(1):55-57. 被引量：74
6周钦强,孙炳达,王义.文本自动分类系统文本预处理方法的研究[J].计算机应用研究,2005,22(2):85-86. 被引量：15
7包剑,冀常鹏,李义杰.基于矢量空间模型的文本自动分类系统研究[J].计算机系统应用,2005,14(3):47-49. 被引量：6
8侯汉清 ,章成志 ,郑红 .Web概念挖掘中标引源加权方案初探[J].情报学报,2005,24(1):87-92. 被引量：32
9马文斌,王庆.Web内容过滤实现方法的研究[J].计算机工程,2004,30(B12):588-589. 被引量：4
10唐晓文.基于本体论的文本特征提取[J].电脑与信息技术,2005,13(1):36-38. 被引量：11

同被引文献62

1陈群秀.一个在线义类词库:词网 WordNet[J].语言文字应用,1998(2):95-101. 被引量：31
2焦李成,保铮.进化计算与遗传算法──计算智能的新方向[J].系统工程与电子技术,1995,17(6):20-32. 被引量：23
3张全力,何卫平,秦忠宝,王政.基于样本公共特征的产品设计信息搜集[J].计算机工程,2006,32(3):209-211. 被引量：1
4余力,董斯维,郭斌.电子商务推荐攻击研究[J].计算机科学,2007,34(5):134-138. 被引量：11
5刘振华尹萍.信息隐蔽技术及其应用[M].北京：科学出版社,2002..
6黄萱菁夏迎炬吴立德.基于向量空间模型的文本过滤系统【C】..见:中国中文信息学会二十周年学术会议[C].,2001-11.12-13.
7D W Oard, et al. A Conceptual Framework for Text Filtering,University of Maryland [ R ]. Technical Report EE-TR-96-25CAR- TR- 830CLIS-TR-96-02 CS-TR- 3643,1996.
8S Roberton, D Hull.The TREC-9 Filtering Track Final Report[C] .Proceeding of the Ninth Text Retrieval Conference(TREC-9) ,2001.
9J Morris, G Hirst. I_exical Cohesion Computed by Thesaural relations as an Indicator of the Structure of Text [ J ].Computational Linguistics, 1991,17( 1 ) : 21-48.
10Stairmand M A. A Computational Analysis of Izxical Cohesion with Apphcations in Information Retrieval [ D ]. PhD Tnesis,DeparUnent of Iangu # Engneering. University of Manchester Institute of Science and Technology, 1996.

引证文献13

1赵林,胡恬,黄萱菁,吴立德.基于知网的概念特征抽取方法[J].通信学报,2004,25(7):46-54. 被引量：17
2张全力,何卫平,秦忠宝,王政.基于样本公共特征的产品设计信息搜集[J].计算机工程,2006,32(3):209-211. 被引量：1
3于海燕,陈晓江,冯健,房鼎益.Web文本内容过滤方法的研究[J].微电子学与计算机,2006,23(9):51-54. 被引量：9
4刘林,刘臻.基于知识的网上监控系统的研究[J].微电子学与计算机,2007,24(10):150-152. 被引量：1
5黄文涛,徐凌宇,李严,吴早亮.基于柔性区间的多文本融合提取方法[J].计算机工程,2007,33(24):217-219. 被引量：1
6刘伟成,焦玉英.网络信息过滤的方法与相关技术研究[J].现代图书情报技术,2002(3):48-50. 被引量：32
7田伟,韩海涛,陈静.构建档案用户数据分析引擎的研究[J].档案与建设,2015(3):8-12. 被引量：4
8田伟,韩海涛,陈静.档案用户数据分析引擎建设研究[J].档案管理,2015(1):20-23. 被引量：1
9何静,刘海燕,张惠民.基于文本的内容过滤算法的比较[J].计算机工程,2002,28(11):9-10. 被引量：11
10尤文建,李绍滋,李堂秋.基于词汇链的文本过滤模型[J].计算机应用研究,2003,20(9):32-35. 被引量：9

二级引证文献93

1席萌,郭巧.基于语境关联的Web信息过滤算法[J].华中科技大学学报（自然科学版）,2003,31(S1):102-104. 被引量：1
2彭昱忠,元昌安,王艳,覃晓.基于内容理解的不良信息过滤技术研究[J].计算机应用研究,2009,26(2):433-438. 被引量：19
3戚琼华.网络信息检索结果的影响因素及应对策略[J].装甲兵工程学院学报,2002,16(3):77-81. 被引量：1
4王春红,张敏,杨秀荣.基于Web的信息过滤系统的设计与实现[J].电子科技大学学报,2009,38(S1):79-82. 被引量：4
5黄晓斌,邱明辉.网络信息过滤系统研究[J].情报学报,2004,23(3):326-332. 被引量：24
6王茹.图书馆个性化信息服务研究述评[J].图书馆杂志,2004,23(12):13-16. 被引量：20
7张宇光,鞠彦辉.个性化信息服务中的内容过滤技术研究[J].情报科学,2005,23(1):131-133.
8陈建民.基于网络的个性化信息服务研究[J].科技情报开发与经济,2005,15(3):96-98. 被引量：12
9黄晓斌,邱明辉.网络信息过滤方法的比较研究[J].大学图书馆学报,2005,23(1):42-48. 被引量：18
10王少宇,杜娟,秦前清.基于内容的网页信息处理方法[J].计算机应用,2005,25(4):977-978. 被引量：3

1林鸿飞,战学刚,姚天顺.文本结构分析与基于示例的文本过滤[J].小型微型计算机系统,2000,21(4):422-425. 被引量：23
2林鸿飞,战学刚,姚天顺.基于概念扩充的中文文本过滤模型[J].计算机科学,2000,27(2):88-90. 被引量：7
3张爱琦,左万利,王英,梁浩.基于多个领域本体的文本层次被定义聚类方法[J].计算机科学,2010,37(3):199-204. 被引量：11
4唐晓文.基于本体论的文本特征提取[J].电脑与信息技术,2005,13(1):36-38. 被引量：11
5余晓山,吴扬扬.基于MapReduce的文本层次聚类并行化[J].计算机应用,2014,34(6):1595-1599. 被引量：5
6刘军万,刘飞飞.基于潜在语义索引的文本结构分析方法的研究[J].情报杂志,2004,23(1):56-58. 被引量：4
7林鸿飞,战学刚,姚天顺.基于概念的文本结构分析方法[J].计算机研究与发展,2000,37(3):324-328. 被引量：35
8高波,赵政.文本层次分类系统的研究[J].计算机工程与应用,2006,42(11):176-178. 被引量：5
9尉景辉,何丕廉,孙越恒.基于K-Means的文本层次聚类算法研究[J].计算机应用,2005,25(10):2323-2324. 被引量：18
10梁文婷,何中市,龙华,田春娥.改进传统文本结构关系图的文本结构分析[J].微计算机信息,2009,25(3):213-215. 被引量：5

大连理工大学学报

2000年第3期

浏览历史

内容加载中请稍等...

基于示例的中文文本过滤模型被引量：13

参考文献4

二级参考文献8

共引文献46

同被引文献62

引证文献13

二级引证文献93

相关作者

相关机构

相关主题

浏览历史

基于示例的中文文本过滤模型 被引量：13

参考文献4

二级参考文献8

共引文献46

同被引文献62

引证文献13

二级引证文献93

相关作者

相关机构

相关主题

浏览历史

基于示例的中文文本过滤模型被引量：13