融合关键词增补与领域本体的共词分析方法研究被引量：23

Research of Co-word Analysis Method of Combining Keywords Extension and Domain Ontology

导出

摘要针对传统共词分析中的不足,提出一个新的共词分析过程模型,该模型从两个方面对传统共词分析方法进行改进。首先,自标引关键词不能全面描述论文主题内容,需对其进行增补。选择高频自标引关键词构成增补词典,利用基于增补词典的分词技术从标题中提取论文候选关键词,按一定规则进行增补。其次,针对共现频次较难准确描述词对相似度,引入领域本体来计算高频关键词对的语义相似度,综合考虑共现频次和语义相似度值得到词对的相关度值。用相关度来描述词对相似度,并作为构建共词矩阵的依据。最后通过实验证明改进方法的有效性。 This paper puts forward a new co -word analysis process model according to the deficiency in tradition co - word analysis. This model improves the traditional methods of co - word analysis from two aspects. At first, this paper supplements the indexing keywords because they cannot fully describe the topic content of the thesis. High frequency words from indexing key words are chosen to constitute a supplementary dictionary. Paper candidate keywords are extracted from the title by the word segmentation technology based on the supplement dictionary, and then the candidate keywords are supplemented according to certain rules. Secondly, domain Ontology is introduced to calculate the high frequency key- words for semantic similarity because the co - occurrence frequencies are difficult to accurately describe the similarity be- tween two words, considering the co -occurrence frequency and semantic similarity. Then the correlation is used to describe the word similarity, and is the basis of building co - word matrix. Finally, experiments prove the effectiveness of this improved method.

作者唐晓波肖璐

机构地区武汉大学信息资源研究中心

出处《现代图书情报技术》 CSSCI 北大核心 2013年第11期60-67,共8页 New Technology of Library and Information Service

基金国家自然科学基金项目"社会化媒体集成检索与语义分析方法研究"(项目编号:71273194)的研究成果之一

关键词共词分析增补词典领域本体 Co- word analysis Extension dictionary Domain Ontology

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献24

1廖胜姣,肖仙桃.基于文献计量的共词分析研究进展[J].情报科学,2008(6):855-859. 被引量：47
2钟伟金,李佳.共词分析法研究(一)——共词分析的过程与方式[J].情报杂志,2008,27(5):70-72. 被引量：476
3李颖,贾二鹏,马力.国内外共词分析研究综述[J].新世纪图书馆,2012(1):23-27. 被引量：27
4李纲,李轶.一种基于关键词加权的共词分析方法[J].情报科学,2011,29(3):321-324. 被引量：31
5邵作运,李秀霞.共词分析中作者关键词规范化研究——以图书馆个性化信息服务研究为例[J].情报科学,2012,30(5):731-735. 被引量：24
6沈君,王续琨,陈悦,高继平,滕立,梁俊伟.战略坐标视角下的专利技术主题分析——以第三代移动通信技术为例[J].情报杂志,2012,31(11):88-94. 被引量：26
7韩红旗,安小米.科技论文关键词的战略图分析[j].情报理沦与实践,2012,35(9):86-90.
8章成志.自动标引研究的回顾与展望[J].现代图书情报技术,2007(11):33-39. 被引量：39
9邓三鸿,王昊,秦嘉杭,苏新宁.基于字角色标注的中文书目关键词标引研究[J].中国图书馆学报,2012(2):38-49. 被引量：10
10肖红,许少华.基于词汇同现模型的关键词自动提取方法研究[J].沈阳理工大学学报,2009,28(5):38-41. 被引量：4

二级参考文献232

1曹倩,丁艳,王超,潘金贵.汉语自动分词研究及其在信息检索中的应用[J].计算机应用研究,2004,21(5):71-74. 被引量：18
2文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
3苏菲,王丹力,戴国忠.基于标记的规则统计模型与未登录词识别算法[J].计算机工程与应用,2004,40(15):43-45. 被引量：13
4孙茂松,肖明,邹嘉彦.基于无指导学习策略的无词表条件下的汉语自动分词[J].计算机学报,2004,27(6):736-742. 被引量：37
5李善平,尹奇韡,胡玉杰,郭鸣,付相君.本体论研究综述[J].计算机研究与发展,2004,41(7):1041-1052. 被引量：274
6俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量：29
7李素建,王厚峰,俞士汶,辛乘胜.关键词自动标引的最大熵模型应用研究[J].计算机学报,2004,27(9):1192-1197. 被引量：92
8孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
9朱东华,袁军鹏.基于数据挖掘的科技监测方法研究[J].管理工程学报,2004,18(4):135-139. 被引量：59
10龚汉明,周长胜.汉语分词技术综述[J].北京机械工业学院学报,2004,19(3):52-55. 被引量：26

共引文献1072

1饶斌,谢勇旗.近20年我国职业院校教师培训研究可视化分析——研究现状、热点主题与前沿趋势[J].教育科学论坛,2024(15):64-71.
2郑嘉玲.知识图谱镜像下我国高职院校课程思政研究[J].教育科学论坛,2020(36):12-21. 被引量：2
3张荣俊,陈涛,阮敏.基于共词分析法的国内精准营销研究热点探析[J].中国发展,2021,21(3):58-65. 被引量：1
4刘天佐,廖湘莲.我国基本公共服务均等化研究主题演进可视化分析[J].行政与法,2020(11):19-30.
5丁美荣,冯伟森,黄荣翔,罗嘉俊.基于预训练模型和基础词典扩展的酒店评论情感分析[J].计算机系统应用,2022,31(11):296-308. 被引量：5
6曾志伟,刁明光,王欣鹏,何炳辉.基于口罩评论数据的用户情感趋势与关注分析[J].计算机系统应用,2020,29(12):263-267.
7魏伟,郭崇慧,邢小宇.基于语义关联规则的试题知识点标注及试题推荐[J].数据分析与知识发现,2020,4(2):182-191. 被引量：8
8熊欣,王昊,张海潮,张宝隆.中文术语粒度对其区分能力测度的影响分析[J].数据分析与知识发现,2020,4(2):143-152. 被引量：2
9唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：43
10王菲.我国体育旅游研究综述——基于CNKI文献计量可视化分析[J].体育视野,2020(8):7-8. 被引量：1

同被引文献405

1赵庆龄,路文如.土壤重金属污染研究回顾与展望--基于web of science数据库的文献计量分析[J].环境科学与技术,2010,33(6):105-111. 被引量：71
2龚思婷,孙建军.网络信息生命力评价——基于网络信息的增长与老化模型[J].情报杂志,2012,31(5):75-79. 被引量：9
3李亚明.训诂学研究方法的继承与创新[J].古籍整理研究学刊,1995(6):13-27. 被引量：5
4李珊珊,张文毓,孙长虹,张楠,薛念涛.基于文献计量分析土壤修复的研究现状与趋势[J].环境工程,2015,33(5):160-165. 被引量：31
5刘鲁红.浅谈主题标引规范化[J].情报理论与实践,2004,27(4):367-368. 被引量：5
6罗式胜.科学文献关键词链的概念──一种统计分析方法[J].情报学报,1994,13(2):126-131. 被引量：23
7陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005,23(2):149-154. 被引量：820
8秦春秀,赵捧未,窦永香.一种基于本体的语义标引方法[J].情报理论与实践,2005,28(3):244-246. 被引量：7
9朱庆生,邹景华.基于本体论的论文检索[J].计算机科学,2005,32(5):172-173. 被引量：20
10侯玉芳,耿骞.KIM——一个基于本体的信息检索平台[J].现代图书情报技术,2005(8):27-31. 被引量：7

引证文献23

1许鑫,郭金龙.基于领域本体的专题库构建——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):2-9. 被引量：18
2郭金龙,洪韵佳,许鑫.中华烹饪文化领域本体构建及其应用[J].现代图书情报技术,2013(12):10-18. 被引量：7
3洪韵佳,许鑫.基于领域本体的知识库多层次文本聚类研究——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):19-26. 被引量：9
4金碧漪,郭金龙,许鑫.利用领域本体优化文档检索的研究——基于KIM平台的设计与实现[J].现代图书情报技术,2013(12):27-33. 被引量：3
5陈果,胡昌平.科研领域关键词网络的结构特征与启示——基于图情学科的实证研究[J].现代图书情报技术,2014(7):84-91. 被引量：10
6陈果,肖璐,赵雪芹.领域知识分析中的关键词选择方法研究——一种以学科为背景的全局视角[J].情报学报,2014,33(9):959-968. 被引量：20
7关鹏,王曰芬.基于LDA主题模型和生命周期理论的科学文献主题挖掘[J].情报学报,2015,34(3):286-299. 被引量：47
8宋广宇,孙建军.基于中介度揭示学科热点与传统词频统计法结果比较研究——以链接分析领域为例[J].情报杂志,2016,35(3):137-141. 被引量：2
9孙建军,肖璐.“互联网+”环境下情报工作的思考[J].中国科技资源导刊,2016,48(1):4-9. 被引量：2
10巴志超,李纲,朱世伟.共现分析中的关键词选择与语义度量方法研究[J].情报学报,2016,35(2):197-207. 被引量：26

二级引证文献290

1黎倩伶,张新平.我国抗菌药物耐药性研究热点分析[J].医学信息学杂志,2019,40(12):58-61.
2邓珍荣,汤园钰,杨睿,张永林.基于关键词与指针生成网络的摘要生成算法[J].计算机系统应用,2022,31(11):246-253. 被引量：2
3黄俊又,努尔古丽·阿不都苏力.基于抖音短视频的重庆洪崖洞文旅IP分析[J].新媒体研究,2022,8(23):67-72. 被引量：1
4陈琦,张君冬,郑婉婷,杨硕.基于LDA模型的中医药人工智能领域主题演化分析[J].世界科学技术-中医药现代化,2022,24(9):3315-3324. 被引量：10
5高丹,何琳,孙帆,刘建斌.国际数字人文领域研究方法的量化分析及启示研究[J].情报科学,2022,40(10):114-122. 被引量：6
6汤园玲.2000-2020年人工智能学习研究的趋势和问题——基于Citespace分析[J].汉字文化,2023(8):180-182.
7傅玉,段文军,毛秀玲.我国边境旅游政策特征与热点研究——基于文献计量和共词分析[J].边疆经济与文化,2022(12):38-44. 被引量：1
8亮亮.在海底安个家[J].大自然探索,2000(6):69-72.
9许鑫,郭金龙.基于领域本体的专题库构建——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):2-9. 被引量：18
10郭金龙,洪韵佳,许鑫.中华烹饪文化领域本体构建及其应用[J].现代图书情报技术,2013(12):10-18. 被引量：7

1任晶钰.科技期刊中英文关键词的不一致现象[J].黑龙江科技信息,2010(35):242-242.
2许爱琴,王梦洁,刘永坚,王卫华.一种新的生成候选关键词集的方法[J].武汉理工大学学报（信息与管理工程版）,2013,35(6):816-819.
3娄玉娟,徐慧.中文文本关键词抽取方法的研究[J].企业技术开发（下半月）,2011(4):106-107. 被引量：1
4学术论文关键词的选择与规范[J].成都电子机械高等专科学校学报,2010,13(3):39-39.
5开户农村电商时代[J].广东农村实用技术,2015,0(4):4-6.
6蒋辉,阳小华.基于文档与搜索结果上下文的查询扩展方法[J].计算机应用,2009,29(3):852-853. 被引量：6
7张红鹰.基于模糊处理的中文文本关键词提取算法[J].现代图书情报技术,2009(5):39-43. 被引量：6
8张红鹰.中文文本关键词提取算法[J].计算机系统应用,2009,18(8):73-76. 被引量：7
9王贵娟,李秀霞,陈强.文献计量及共词分析视角下的国内云计算热点研究[J].图书馆界,2012(1):46-50. 被引量：10
10时永宾,余青松.基于共现词卡方值的关键词提取算法[J].计算机工程,2016,42(6):191-195. 被引量：4

现代图书情报技术

2013年第11期

浏览历史

内容加载中请稍等...

融合关键词增补与领域本体的共词分析方法研究被引量：23

参考文献24

二级参考文献232

共引文献1072

同被引文献405

引证文献23

二级引证文献290

相关作者

相关机构

相关主题

浏览历史

融合关键词增补与领域本体的共词分析方法研究 被引量：23

参考文献24

二级参考文献232

共引文献1072

同被引文献405

引证文献23

二级引证文献290

相关作者

相关机构

相关主题

浏览历史

融合关键词增补与领域本体的共词分析方法研究被引量：23