基于关联规则和语义规则的本体概念提取研究被引量：8

Research on Domain Ontology Concept Extraction Based on Association Rules and Semantic Rules

下载PDF

导出

摘要为解决基于非结构化文本的中文领域本体概念提取效率和准确率不理想的问题,提出了一种基于关联规则和语义规则的领域本体概念提取方法。利用领域一致性和相关性检查以及关联规则分别获取候选概念和关系集合,计算候选概念在领域术语关系中的深度和广度,利用深度和广度信息反馈概念隶属度的思想,定量分析术语与领域的隶属程度,进行本体概念的领域隶属度检查,完成领域本体概念的提取。实验结果表明,该方法提高了领域本体概念的提取效率和准确率,具有可行性和合理性,领域本体概念的提取准确率提高了12%左右。 In order to solve the problems that extraction efficiency and the accuracy of Chinese domain ontology concept based on unstructured text is not ideal. We present a method of domain ontology concept extraction based on semantic rules and association rules. A set of candidate concepts and relationships are obtained by using field consistency, correlative checks and association rules, and the depth and breadth of relations of every concept in candidate concepts are computed, using the depth and breadth information to feedback the degree of membership between terminology and field, with the way of quantitative analysis to complete the extraction of domain ontology concepts. The experimental results show that this method has feasibility and rationality, the concept of domain ontology extraction accuracy increased by about 12%.

作者贺海涛郑山红李万龙彭馨仪

机构地区长春工业大学计算机科学与工程学院

出处《吉林大学学报（信息科学版）》 CAS 2014年第6期657-663,共7页 Journal of Jilin University（Information Science Edition）

基金吉林省自然科学基金资助项目(20130101060JC) 吉林省教育厅十二五科学技术研究基金资助项目(2014131 2014125)

关键词本体概念提取关联规则语义规则领域隶属度检查 ontology concept extraction association rules semantic rules domain membership checking

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1GRUBER T. A Translation Approach to Portable Ontology Specifications [ J] . Knowledge Acquisition,1993 , 5(2) : 199-220.
2杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847. 被引量：241
3SHAMSFARD M, BARFOROUSH A. Learning Ontologies from Natural Language Texts [J]. International Journal of HumanComputer Studies, 2004,60( 1) ; 17-28.
4范小丽,刘晓霞.文本分类中互信息特征选择方法的研究[J].计算机工程与应用,2010,46(34):123-125. 被引量：30
5陈士超,郁滨.面向术语抽取的双阈值互信息过滤方法[J].计算机应用,2011,31(4):1070-1073. 被引量：10
6张翼,刘玉华,许凯华,骆珍荣.一种基于互信息的复杂网络节点重要性评估方法[J].计算机科学,2011,38(6):88-89. 被引量：31
7周戈.一种基于反向文本频率互信息的文本挖掘算法研究[J].计算机应用研究,2012,29(2):487-489. 被引量：9
8LEE-FENG C. PAT-Tree-Based Adaptive Key Phrase Extraction for Intelligent Chinese Information Retrieval [J]. InformationProcess and Management, 1999, 35(4): 501-521.
9陈宇,朱建锋,吴毅坚,赵文耘.一种基于领域本体的新术语扩充方法[J].计算机工程,2011,37(7):24-27. 被引量：8
10张玉芳,杨芬,熊忠阳,陈小莉.基于上下文的领域本体概念和关系的提取[J].计算机应用研究,2010,27(1):74-76. 被引量：14

二级参考文献99

1徐燕,李锦涛,王斌,孙春明,张森.不均衡数据集上文本分类的特征选择研究[J].计算机研究与发展,2007,44(z2):58-62. 被引量：20
2刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：197
3陈勇,胡爱群,胡啸.通信网中节点重要性的评价方法[J].通信学报,2004,25(8):129-134. 被引量：89
4刘君强,孙晓莹,王勋,潘云鹤.挖掘最大频繁模式的新方法[J].计算机学报,2004,27(10):1328-1334. 被引量：15
5周涛,柏文洁,汪秉宏,刘之景,严钢.复杂网络研究概述[J].物理,2005,34(1):31-36. 被引量：235
6张锋,许云,侯艳,樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究,2005,22(5):72-73. 被引量：36
7胡佳妮,徐蔚然,郭军,邓伟洪.中文文本分类中的特征选择算法研究[J].光通信研究,2005(3):44-46. 被引量：47
8杜波,田怀凤,王立,陆汝占.基于多策略的专业领域术语抽取器的设计[J].计算机工程,2005,31(14):159-160. 被引量：26
9郑家恒,卢娇丽.关键词抽取方法的研究[J].计算机工程,2005,31(18):194-196. 被引量：41
10杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847. 被引量：241

共引文献385

1陈德彦,赵宏,张霞.专家视图与本体视图的语义映射方法[J].软件学报,2020(9):2855-2882. 被引量：7
2胡金柱,舒江波,陈志伟,杜志强,窦桂琴.基于本体构件的工作流检索研究[J].四川大学学报（工程科学版）,2007,39(S1):64-67.
3王芳,滕桂法,张玉新,任力生,马建斌,赵洋.基于本体的农业问答语义管理系统设计与实现[J].河北农业大学学报,2008,31(5):115-117. 被引量：2
4唐涛.基于文本挖掘的领域本体学习模型研究[J].图书情报工作,2010,54(S2):348-352. 被引量：3
5于洪,杨显.微博中节点影响力度量与传播路径模式研究[J].通信学报,2012,33(S1):96-102. 被引量：27
6翟东海,王佳君,聂洪玉,崔静静.基于互信息的热点词发现和突发性话题检测研究[J].西藏大学学报（社会科学版）,2013,28(4):82-87. 被引量：2
7田晓丹,王庆林,李原.基于特征向量的本体概念上下位关系验证[J].中南大学学报（自然科学版）,2013,44(S2):351-354. 被引量：1
8赖清楠,马皓,宋维佳,李婷婷,蒋广学,张蓓.高校BBS与微博的用户社交行为特征分析[J].通信学报,2013,34(S2):99-106. 被引量：3
9李亢,李新明,刘东.面向数据语义集成的装备领域本体构建研究[J].系统仿真学报,2015,27(5):1071-1080. 被引量：6
10王珊,张俊,彭朝晖,战疆,杜小勇,Zhao-hui Xiao-yong.基于本体的关系数据库语义检索[J].计算机科学与探索,2007,1(1):59-78. 被引量：15

同被引文献69

1刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：197
2任禾,曾隽芳.一种基于信息熵的中文高频词抽取算法[J].中文信息学报,2006,20(5):40-43. 被引量：22
3何燕,穗志方,段慧明,俞士汶.一种结合术语部件库的术语提取方法[J].计算机工程与应用,2006,42(33):4-7. 被引量：17
4刘克彬,李芳,刘磊,韩颖.基于核函数中文关系自动抽取系统的实现[J].计算机研究与发展,2007,44(8):1406-1411. 被引量：58
5何琳.领域本体的关系抽取研究[J].现代图书情报技术,2008(4):35-38. 被引量：8
6荆涛,左万利,孙吉贵,车海燕.中文网页语义标注：由句子到RDF表示[J].计算机研究与发展,2008,45(7):1221-1231. 被引量：31
7江敏,肖诗斌,王弘蔚,施水才.一种改进的基于《知网》的词语语义相似度计算[J].中文信息学报,2008,22(5):84-89. 被引量：106
8周浪,张亮,冯冲,黄河燕.基于词频分布变化统计的术语抽取方法[J].计算机科学,2009,36(5):177-180. 被引量：27
9段寿建,夏幼明,甘健侯.基于本体和Lucene的语义检索模型设计与实现[J].现代电子技术,2009,32(12):36-38. 被引量：6
10孙霞,王小凤,董乐红,吴江.术语关系自动抽取方法研究[J].计算机科学,2010,37(2):189-191. 被引量：7

引证文献8

1董洋溢,李伟华,于会.基于混合余弦相似度的中文文本层次关系挖掘[J].计算机应用研究,2017,34(5):1406-1409. 被引量：20
2董洋溢,李伟华,于会.文本特征和复合统计量的领域术语抽取方法[J].西北工业大学学报,2017,35(4):729-735. 被引量：7
3王旭阳,姜喜秋.特定领域概念属性关系抽取方法研究[J].吉林大学学报（信息科学版）,2017,35(4):430-437. 被引量：1
4于超,王璐,程道文.基于本体的教育资源语义检索系统研究[J].吉林大学学报（信息科学版）,2018,36(2):207-212. 被引量：34
5赵美玲,刘胜全,刘艳,郭竹为,符贤哲.基于动态主题模型的舆情本体概念抽取[J].计算机工程与设计,2018,39(4):1174-1179. 被引量：3
6杜翠凤,陈雍君,沈文明,李建中.基于语义规则和关联规则的特定领域中文术语字典的构造[J].移动通信,2019,43(2):92-96. 被引量：2
7张倩倩,田学东,杨芳,李新福.基于数学文本和表达式转换的融合检索模型[J].计算机工程,2019,45(3):175-181. 被引量：4
8周志浩,李建波.基于语言特征和复合测量的农业术语自动抽取研究[J].科学技术与工程,2022,22(24):10625-10630. 被引量：2

二级引证文献73

1李冉.基于语义图模型的跨语言网络信息检索方法研究[J].周口师范学院学报,2020(2):100-103. 被引量：3
2盛泳潘,付雪峰,吴天星.基于开放域抽取的多文档概念图构建研究[J].计算机应用研究,2020,37(1):19-25. 被引量：2
3刘刚.WINDOWS下提取汉字字模[J].电脑编程技巧与维护,2000(5):8-10.
4于丽娅,王自勤.基于创新性评估的机电产品专利知识挖掘系统[J].机械设计与制造,2017(9):86-89. 被引量：4
5黄以宝.基于本体的教育资源语义检索系统的实现探讨[J].信息与电脑,2018,30(18):182-184. 被引量：1
6吴国祥,谢大同.国内基于本体的网络教育资源建设研究综述[J].情报探索,2018(10):130-134. 被引量：2
7李金,马文超,何兵,王琭璐,杨岸宁,王颖,梁洪.基于改进文本特征的文本相似度研究[J].黑龙江大学工程学报,2018,9(1):46-52.
8骆亮.基于内容推荐算法和余弦相似度算法的领导决策辅助信息系统[J].广西科学院学报,2018,34(2):143-150. 被引量：4
9张越,刘琦岩,张玄玄,望俊成.科技成果转化政策文本中的领域关键词汇提取研究[J].中国科技资源导刊,2018,50(3):68-75. 被引量：4
10张倩倩,田学东,杨芳,李新福.基于数学文本和表达式转换的融合检索模型[J].计算机工程,2019,45(3):175-181. 被引量：4

1李道旺,袁锋.一种医用酶本体概念提取模型的构建[J].聊城大学学报（自然科学版）,2013,26(3):91-95.
2陆晓华,张宇,钱进.基于图数据库的电影知识图谱应用研究[J].现代计算机,2016,22(5):76-83. 被引量：7
3周玉新.命名实体识别研究发展综述[J].科技风,2016(16):99-99. 被引量：1
4祝伟华,卢熠,刘斌斌.基于HMM的Web信息抽取算法的研究与应用[J].计算机科学,2010,37(2):203-206. 被引量：12
5罗亚波,肖田元.同步协同设计中基于关联关系的资源调度方法[J].计算机集成制造系统-CIMS,2004,10(4):399-403. 被引量：6
6程洪涛.基于XML的非结构化文本数据转换研究与实现[J].现代计算机,2013,19(6):51-54. 被引量：3
7谢子超.非结构化文本的自动分类检索平台的研究与实现[J].软件,2015,36(11):112-114. 被引量：10
8王宁宁,陈建辉.基于领域相关性度量的抑郁症药物概念抽取[J].计算机工程与应用,2016,52(19):140-145. 被引量：1
9孟令雅.自动控制理论教学漫谈[J].电气电子教学学报,2006,28(1):48-50. 被引量：29
10程国.基于模糊最大间距准则的人脸特征提取方法[J].计算机与数字工程,2014,42(8):1355-1359. 被引量：4

吉林大学学报（信息科学版）

2014年第6期

浏览历史

内容加载中请稍等...

基于关联规则和语义规则的本体概念提取研究被引量：8

参考文献15

二级参考文献99

共引文献385

同被引文献69

引证文献8

二级引证文献73

相关作者

相关机构

相关主题

浏览历史

基于关联规则和语义规则的本体概念提取研究 被引量：8

参考文献15

二级参考文献99

共引文献385

同被引文献69

引证文献8

二级引证文献73

相关作者

相关机构

相关主题

浏览历史

基于关联规则和语义规则的本体概念提取研究被引量：8