基于层层深入的关键词-叙词同义关系自动识别研究被引量：3

Automatic Recognition Method Based on Synonymous Keyword-Descriptor

导出

摘要本文以科技文献中共现关键词-叙词(下称"共现词对")为挖掘对象,首先,以字面相似法统计字面相似值,以最高相似值方式认定每个叙词同义对应的唯一关键词(起点词);然后使用概率法计算词对的共现强弱,并以叙词为单位按共现紧密度由高到低排列,以起点词作为参考词,根据"同义相斥"、"相关相吸"的共现规律,按照一定的原则,逐个层层深入识别所有共现词对。实验结果表明,基于层层深入法的识别方式,是共现关键词-叙词同义关系识别的可靠、稳定的方法。 In the paper, a new method was proposed to automatic recognition of synonymous about keyword-descriptor co-occurrence （co-words for short）.The study was made in 3 fundamental steps as follows： 1. The only keywords, called starting word, corresponding to its descriptor, were Identified by word-form-similarity approach. 2. The tight co-words, which was divided and Ranged from high to low by the statistical value of probability method and frequency of co-words. 3. Under the descriptor-centered, Synonymous keywords will be discriminated by starting word according to the co-words principle of ＂repulsion between synonymous keywords＂ and ＂attraction between Semantic Relatedness keywords＂. The results show that the new recognition method is hopeful to become a stabled and reliable method to the synonymous recognition between keywords and descriptor.

作者钟伟金

机构地区广东医学院图书馆

出处《情报科学》 CSSCI 北大核心 2013年第4期84-88,共5页 Information Science

基金教育部人文社会科学研究一般项目(10YJC870051) 广东高校优秀青年创新人才培育项目(wym09089)

关键词同义词识别共现关键词-叙词字面相似概率法 synonymous recognition keyword-descriptor co-occurrence word-form-similarity probability method

分类号 G254 [文化科学—图书馆学]

引文网络
相关文献

参考文献19

1Fumas G W , LandauerTK., Gomez LM, Dumais S T.The vocabulary problem in human--system communi- cation[C].Comm.ACM, 1987:30.
2赵捷,司莉,周李梅,柴源,邓伊婷.国外叙词表的应用与发展趋势探讨[J].图书馆建设,2012(3):58-62. 被引量：11
3胡德华,梁丽明.PubMed主题词检索与自由词检索的检索效率比较研究[J].情报科学,2006,24(5):717-721. 被引量：13
4tseng Y H. automatic thesaurus generation for Chinese documents[J]. Journal of the American society for in- formation science and technology, 2002,53(13): 1130-1138.
5孙海霞,吴英杰,李军莲,李丹亚.中文关键词-主题词自动映射方法研究综述[J].医学信息学杂志,2012,33(3):47-52. 被引量：2
6陈立华.从叙词语言与自然语言的结合看后控制问题[J].情报杂志,2003,22(8):57-58. 被引量：10
7杜慧平,朱晓霞,何琳.网络环境中领域叙词表自动编制方案与关键技术研究[J].情报理论与实践,2011,34(4):102-105. 被引量：4
8杨凝清,刘宁.医学期刊关键词标注与CBMdisc 叙词标引对照研究[J].中国科技期刊研究,2006,17(4):590-592. 被引量：6
9宋明亮.汉语词汇字面相似性原理与后控制词表动态维护研究[J].情报学报,1996,15(4):261-271. 被引量：19
10王源,吴晓滨,涂从文,刘滨,章元峰,王金娥.后控规范的计算机处理[J].现代图书情报技术,1993(2):4-7. 被引量：30

二级参考文献104

1周宁丽.网络环境下后控制系统建设之研究[J].现代图书情报技术,1997(S1):133-136. 被引量：3
2王源.中国化学文献检索系统的建库方针和今后发展[J].现代图书情报技术,1987(1):9-12. 被引量：2
3宋明亮.我国报纸信息数据库开发的现状与对策[J].中国图书馆学报,1995,21(1):60-65. 被引量：18
4陆勇,侯汉清.用于信息检索的同义词自动识别及其进展[J].南京农业大学学报（社会科学版）,2004,4(3):87-93. 被引量：25
5金燕,张玉峰.知识检索中自然语言控制机制研究[J].中国图书馆学报,2004,30(6):56-58. 被引量：11
6张琪玉.汉语关键词法探讨[J].图书馆论坛,1993,13(1):3-7. 被引量：7
7王源,吴晓滨,涂从文,刘滨,章元峰,王金娥.后控规范的计算机处理[J].现代图书情报技术,1993(2):4-7. 被引量：30
8宋明亮.论对自然语言的控制[J].情报理论与实践,1994,17(2):27-30. 被引量：10
9韩冬梅.后控词表的设计开发与利用[J].情报学报,1994,13(4):266-273. 被引量：6
10张琪玉.论后控制词表[J].图书情报工作,1994,38(1):1-4. 被引量：55

共引文献261

1朱倩,史燕,程显毅,蔡月红.基于HNC词的聚类[J].郑州大学学报（理学版）,2009,41(2):44-47. 被引量：1
2白长财,韩璐,权洪峰,黄青,张彩芳.医药学文献快速高效检索与利用[J].高校医学教学研究（电子版）,2012,2(1):56-61.
3孙琦,徐宽.基于因特网的动态规范词表构想机制[J].图书情报工作,2010,54(S2):357-358.
4李斌,宋小华.本体的中文语义网查询优化[J].电脑编程技巧与维护,2009(S1):112-115.
5赵剑,袁敏,张倞.基于图像领域谈专利检索的关键词选取与搭配[J].电视技术,2013,37(S2):185-188.
6王兰成.主题信息检索应用数据库技术的研究现状与展望[J].中国图书馆学报,2004,30(4):58-61.
7陆勇,侯汉清.用于信息检索的同义词自动识别及其进展[J].南京农业大学学报（社会科学版）,2004,4(3):87-93. 被引量：25
8片玉君.《汉语主题词表》的新进展及其对中文自动标引的影响[J].现代图书情报技术,1994(3):22-25.
9王兰成,李超.改进的中文同义词相似匹配方法[J].中国图书馆学报,2005,31(3):61-64. 被引量：6
10陆长旭.后控词表的编制方法[J].中国图书馆学报,1994,20(6):18-21.

同被引文献41

1侯汉清,薛春香.用于中文信息自动分类的《中图法》知识库的构建[J].中国图书馆学报,2005,31(5):82-86. 被引量：25
2胡德华,梁丽明.PubMed主题词检索与自由词检索的检索效率比较研究[J].情报科学,2006,24(5):717-721. 被引量：13
3张素芳.国外跨语言信息检索中的翻译歧义性问题研究综述[J].图书馆学研究,2006(6):72-75. 被引量：8
4杨凝清,刘宁.医学期刊关键词标注与CBMdisc 叙词标引对照研究[J].中国科技期刊研究,2006,17(4):590-592. 被引量：6
5杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847. 被引量：242
6陈先来,肖晓旦,杜方冬.基于互信息构建关键词—叙词对照表的研究[J].情报理论与实践,2006,29(5):567-569. 被引量：9
7薛云,叶东毅,张文德.基于《中国分类主题词表》的领域本体构建研究[J].情报杂志,2007,26(3):15-18. 被引量：16
8吴东辰.网络信息检索中叙词语言的应用[J].中国教育网络,2007(3):74-75. 被引量：2
9STUDER R, BENJAMINS V R, FENSEI D. Knowledge engi- neering: principles and methods [ J]. Data & Knowledge En- gineering, 1998, 25 (1/2): 161-197.
10CARVALHEIRA L C C, GOMI E S. A method for semi-auto- matic creation of ontologies based on texts [ M ] //Advances in Conceptual Modeling Foundations and Applications. New Zeal- and: [s. n. ] , 2007.

引证文献3

1钟伟金.基于共现词网改造的领域本体自动构建模型研究[J].情报理论与实践,2014,37(1):131-135. 被引量：4
2李佳.基于词共现的跨语言检索平台研究[J].情报杂志,2015,34(8):195-198. 被引量：3
3蒲杨.叙词在INIS数据库检索中的应用研究[J].图书情报工作,2015,59(S2):171-176. 被引量：1

二级引证文献8

1张斌.共词网络的结构与演化:概念与理论进展[J].情报杂志,2014,33(7):103-109. 被引量：34
2张云中,张丛昱.利用《中分表》与大众分类法构建本体:基于融合的视角[J].情报科学,2016,34(10):49-55. 被引量：2
3侯剑华,杨秀财.非正式学术共同体对知识传播的影响研究——以国际图书情报领域为例[J].情报杂志,2017,36(2):176-181. 被引量：6
4刘琦,韦昌法,刘东波,杨嘉诚,周婉珠,匡文轩,晏峻峰.袁肇凯教授学术研究可视化知识图谱分析[J].湖南中医药大学学报,2019,39(4):489-494. 被引量：5
5苏晓娟,张英杰,白晨,吴思.科技大数据背景下的中英双语语料库的构建及其特点研究[J].中国科技资源导刊,2019,51(6):87-92. 被引量：5
6安欣宇,于诗睿,张晗.基于知识图谱的精神分裂症药物知识发现[J].中华医学图书情报杂志,2021,30(10):1-7. 被引量：3
7房小可.面向社会记忆重构的档案信息语义组织研究[J].档案学研究,2022(2):77-82. 被引量：5
8张国防,王鑫,徐建民.基于主题词共现的文档非对称关系量化研究[J].数据分析与知识发现,2023,7(3):110-120. 被引量：1

1钟伟金.共现关键词—叙词同义关系自动识别研究——基于互信息法、概率法的对比分析[J].图书情报工作,2012,56(18):122-126. 被引量：8
2刘华梅,侯汉清.基于情报检索的汉语同义词识别初探[J].情报理论与实践,2005,28(4):373-375. 被引量：11
3杨永福,劳学群.技术预测[J].知识就是力量,1994(3):5-7.
4孙莉萍.“平安世博”系列报道迎世博:我们不是局外人[J].检察风云,2009(14):36-37.
5潘颖,袁润.我国机构知识库研究发展脉络探析[J].现代情报,2015,35(11):18-25.
6尹鸿,王力,尹章池.图书出版的数据挖掘对象、渠道和应用模型[J].科技与出版,2017(3):69-73. 被引量：2
7陆勇,侯汉清.用于信息检索的同义词自动识别及其进展[J].南京农业大学学报（社会科学版）,2004,4(3):87-93. 被引量：25
8冯艳娟.主题标引知识对主题检索的重要性[J].医学信息学杂志,1997,24(3):45-48.
9阎震,秦小红.情报工作与知识产权制度[J].现代情报,2000,20(3):60-60. 被引量：1
10王舒.全球化背景下美剧在中国的跨文化传播研究[J].才智,2014,0(15):267-267. 被引量：2

情报科学

2013年第4期

浏览历史

内容加载中请稍等...

基于层层深入的关键词-叙词同义关系自动识别研究被引量：3

参考文献19

二级参考文献104

共引文献261

同被引文献41

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于层层深入的关键词-叙词同义关系自动识别研究 被引量：3

参考文献19

二级参考文献104

共引文献261

同被引文献41

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于层层深入的关键词-叙词同义关系自动识别研究被引量：3