基于多语境的相关词自动提取系统的设计与实现被引量：6

Design and Implementation of Automatic Extraction Relevance Terms System Based on Multi-context

下载PDF

导出

摘要利用语料库、释义词典、用户检索日志作为识别相关词的语境,设计并实现相关词自动提取系统。实验结果表明,虽然面向相同的基本词汇集合,但是基于不同语境提取的相关词之间的重复率很低,各个结果间的互补性很强,说明结果整合非常有必要。在本系统中,通过直接整合途径构建最后的相关词词表。 This paper chooses corpus, definitions dictionaries and users＇ query logs as contexts to extract the relevance terms. The experiment results show that the overlap ratio of results in different contexts is very low. So, it is necessary to integrate the different results. All of the relevance terms are integrated to a relevance table through direct integration.

作者章成志苏兰芳苏新宁

机构地区南京大学信息管理系

出处《现代图书情报技术》 CSSCI 北大核心 2006年第9期23-28,80,共7页 New Technology of Library and Information Service

关键词相关词多语境语料释义词典用户日志 Relevance term Multi -context Corpus Definitions dictionary Query log

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献18

1贺宏朝,何丕廉,高剑峰,黄昌宁.一种基于上下文的中文信息检索查询扩展[J].中文信息学报,2002,16(6):32-37. 被引量：25
2Voorhees, E. M.. Query expansion using lexieal semantic relations.Proceedings of the 17th Annual International ACM - SIGIR Conference on Research and Development in Information Retrieval, Dublin,Ireland. 1994.61 - 69
3Yufeng Jing, W. B. Croft. An Association Thesaurus for Information Retrieval. Technical Report: UM - CS - 1994 - 017. University of Massachusetts. 1994
4Crouch C. A Cluster - based approach to thesaurus construction. Proceedings of the 11 th Annual International ACM - SIGIR Conference on Research & Development in Information Retrieval, Grenoble, ACM Press, 1988. 309 - 320
5Crouch, C, Yang, B. Experiments in Automatic Statistical Thesaurus Construction. Proceedings of the 15th Annual International ACM - SIGIR Conference on Research & Development in Information Retrieval,Copenhagen, Denmark, ACM Press, 1992.77-88
6Hsinchun Chen, Kevin J , Lynch. Automatic construction of networks of concepts characterizing document databases. IEEE Transactions on Systems, 1992,22 ( 5 ) :885 - 902
7Peter D. Tumey. Mining the Web for synonyms- PMI - IR versus LSA on TOEFL. Proceedings of the 12th European Conference on Machine Learning. Freiburg, Germany. 2001. 491 -502
8Pierre P. Senellart, Vincent D. Blondel, Automatic discovery of similar words, chapter in : Survey of Text Mining, Springer - Verlag,2003
9Masaki Murata, Toshiyuki Kanamaru, Hitoshi Isahara. Automatic synonym acquisition based on matching of definition sentences in multiple dictionaries. CICLing 2005, LNCS 3406. 2005:293 - 304
10崔航,文继荣,李敏强.基于用户日志的查询扩展统计模型[J].软件学报,2003,14(9):1593-1599. 被引量：61

二级参考文献33

1王源,吴晓滨,涂从文,刘滨,章元峰,王金娥.后控规范的计算机处理[J].现代图书情报技术,1993(2):4-7. 被引量：30
2－.现代汉语词典[M].北京:商务印书馆,1994..
3宋明亮张琪玉.报纸文献机助自由标引研究及对后控制词表动态维护的思维：硕士论文[M].空军政治学院,1994,6..
4吴志强侯汉清.经济信息检索后控制词表的研制：硕士论文[M].南京:南京农业大学,1999,6..
5朱毅华侯汉清.智能搜索引擎中同义词识别算法的研究：硕士论文[M].南京:南洋农业大学,2001,6..
6李朝阳侯汉清.汉语科技同义词字面相似度测试[J].理论学术年刊,1998,.
7[1]Miller G A, et al. Introduction to WordNet:an on-line lexical database, International Journal of Lexicography, 1990,3(4) :235 - 312
8[2]Rila Mandala,Takenobu Tokunaga,Hozumi Tanaka,Combining multiple evidence from different types of thesaurus for query expansion,SIGIR, 1999:191 - 197
9[3]Voorhees E M, Harman D K,The sixth Test REtrieval Conferenee(TREC-6) ,Gaithersburg,NIST, 1998
10[4]Salton G, The SMART retrieval system-experiments in automatic document processing, Prentice Hall, 1971:115 -411

共引文献143

1徐莹,杜习英.一种基于遗传算法的查询优化方法[J].电脑知识与技术（过刊）,2007(20):524-526. 被引量：1
2左家莉,王明文,王希.基于Markov网络的信息检索扩展模型[J].清华大学学报（自然科学版）,2005,45(S1):1847-1852. 被引量：9
3朱倩,史燕,程显毅,蔡月红.基于HNC词的聚类[J].郑州大学学报（理学版）,2009,41(2):44-47. 被引量：1
4王微微,夏秀峰,李晓明.一种基于用户行为反馈的兴趣度模型更新算法[J].辽宁大学学报（自然科学版）,2011,38(1):40-45. 被引量：11
5王兰成.主题信息检索应用数据库技术的研究现状与展望[J].中国图书馆学报,2004,30(4):58-61.
6张虎,郑家恒,刘江.语料库词性标注一致性检查方法研究[J].中文信息学报,2004,18(5):11-16. 被引量：9
7傅向华,马兆丰,何明,冯博琴.一种个性化的主题提取和层次发现算法[J].西安交通大学学报,2005,39(2):119-122. 被引量：5
8郭岩,白硕,于满泉.Web使用信息挖掘综述[J].计算机科学,2005,32(1):1-7. 被引量：50
9郑庆华,王朝静,孙霞.一种基于结构化语料库的概念语义网络自动生成算法[J].计算机研究与发展,2005,42(3):478-485. 被引量：7
10王兰成,李超.改进的中文同义词相似匹配方法[J].中国图书馆学报,2005,31(3):61-64. 被引量：6

同被引文献78

1许勇,荀恩东,贾爱平,宋柔.基于互连网的术语定义获取系统[J].中文信息学报,2004,18(4):37-43. 被引量：13
2张琪玉.论后控制词表[J].图书情报工作,1994,38(1):1-4. 被引量：55
3张雪英.基于并行文献数据库的索引语言概念兼容转换[J].情报学报,2005,24(2):161-168. 被引量：2
4戴剑波,侯汉清.图书分类法映射系统设计原理——以《中国图书馆分类法》和《杜威十进分类法》为例[J].情报学报,2005,24(3):299-303. 被引量：29
5王军.词表的自动丰富——从元数据中提取关键词及其定位[J].中文信息学报,2005,19(6):36-43. 被引量：40
6崔光照,曹玲芝,张勋才,王延峰.基于密度的最小生成树聚类算法研究[J].计算机工程与应用,2006,42(5):156-158. 被引量：6
7章志凌,虞立群,陈奕秋,罗海飞,邵晓敏.基于Corpus库的词语相似度计算方法[J].计算机应用,2006,26(3):638-640. 被引量：17
8张选平,马琮,蒋宇,袁明轩,梁平.一种基于概念抽取的相关词推荐模型[J].微电子学与计算机,2006,23(5):163-165. 被引量：2
9朱伟丽,韩宇,肖晓旦,陈先来.医学关键词与叙词对照表自动构建研究[J].现代图书情报技术,2006(8):51-54. 被引量：8
10戴剑波,侯汉清.文献分类法自动映射系统的构建——以《中国图书馆分类法》与《杜威十进分类法》为例[J].情报学报,2006,25(5):594-599. 被引量：19

引证文献6

1章成志,苏新宁.面向信息检索的词汇知识发现[J].现代图书情报技术,2007(1):10-14. 被引量：3
2曲建峰,李芳,张轶华,李鲍.知识组织系统自动映射规则研究与实现——以《杜威十进分类法》和《中国图书馆分类法》为例[J].现代图书情报技术,2012(10):83-88. 被引量：15
3殷希红,乔晓东,张运良.基于引文耦合分析方法的相关词识别[J].情报杂志,2014,33(7):161-164. 被引量：1
4韩普,王东波,朱恒民.基于复杂网络的汉语相似词挖掘和相似度计算研究[J].情报学报,2015,34(8):885-896. 被引量：5
5李法军.基于图论聚类和PageRank的领域后控词表自动构建研究[J].创新科技,2015,15(11):77-80. 被引量：1
6韩普,王东波,王子敏.词汇相似度计算和相似词挖掘研究进展[J].情报科学,2016,34(9):161-165. 被引量：6

二级引证文献29

1熊回香,陈子薇,叶佳鑫.基于共现关系的关键词层次结构构建研究[J].知识管理论坛,2022(4):443-451. 被引量：1
2刘建舟,邵雄凯.面向信息检索的相关词抽取[J].信息系统工程,2012,25(1):19-19. 被引量：1
3施晓华,李芳.知识体系互操作中贝叶斯学习方法应用研究[J].情报杂志,2013,32(8):165-168. 被引量：2
4张洁.《杜威十进分类法》的应用研究进展[J].图书情报工作,2013,57(18):110-115. 被引量：6
5张鹏翼,瞿艳,黄晨.科技创新集群及环境本体的设计和应用[J].现代图书情报技术,2013(12):42-47. 被引量：4
6李珂,宋文.分类法映射研究[J].图书馆杂志,2014,33(12):49-56. 被引量：7
7方延风,陈健.基于词向量距离的相关词变迁研究——以《情报探索》杂志摘要为例[J].情报探索,2015(4):5-7. 被引量：3
8杨锐,刘毅,宋文,周子健,张士男.基于GWT的开放知识组织集成系统设计与实现[J].数字图书馆论坛,2015(5):22-28. 被引量：1
9李鲍,李芳,曲建峰,张轶华,黄镝.分类知识组织体系互操作系统设计与实现[J].图书馆杂志,2015,34(8):78-84. 被引量：2
10朱月琴,谭永杰,张建通,毛波,沈婕,汲超飞.基于Hadoop的地质大数据融合与挖掘技术框架[J].测绘学报,2015,44(B12):152-159. 被引量：42

1刘健,汤小春,晋峰.基于主题元搜索的结果整合算法研究[J].计算机工程与应用,2010,46(35):156-158. 被引量：1
2联机解疑[J].情报理论与实践,1987,10(1):35-38.
3章成志,苏新宁.面向信息检索的词汇知识发现[J].现代图书情报技术,2007(1):10-14. 被引量：3
4张帆,王强.美国战时新闻控制的双重悖论——传播学视野中的美国战时新闻控制[J].现代传播（中国传媒大学学报）,2010,32(3):161-162.
5王云.查找同义词和相关词的循环衍生法[J].核情报工作与研究,1997(2):7-8. 被引量：3
6季丽琴.基于VC++的视频字幕自动提取系统的设计与实现[J].微型机与应用,2014,33(20):38-40. 被引量：1
7汪志莉,张毅.校园记忆之图书馆生活——基于用户日志挖掘的呈现[J].数字图书馆论坛,2014(10):60-63. 被引量：2
8罗晓东,俞科峰.中国电信支撑系统业务规则模型的设计[J].移动通信,2016,40(7):83-86. 被引量：1
9胡迎春,张增芳,梁数.人脸图像嘴巴特征点自动提取系统[J].广西工学院学报,2003,14(2):27-30. 被引量：3
10张旭华.Web2.0网络教学中认知与情感的整合途径构建[J].黑龙江畜牧兽医（下半月）,2013(8):29-30.

现代图书情报技术

2006年第9期

浏览历史

内容加载中请稍等...

基于多语境的相关词自动提取系统的设计与实现被引量：6

参考文献18

二级参考文献33

共引文献143

同被引文献78

引证文献6

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于多语境的相关词自动提取系统的设计与实现 被引量：6

参考文献18

二级参考文献33

共引文献143

同被引文献78

引证文献6

二级引证文献29

相关作者

相关机构

相关主题

浏览历史

基于多语境的相关词自动提取系统的设计与实现被引量：6