基于症状构成成分的上下位关系自动抽取方法被引量：1

Automatic hyponymy extracting method based on symptom components

下载PDF

导出

摘要针对症状间上下位关系具有较强结构特性的问题,提出一种基于症状构成成分的上下位关系自动抽取方法。首先,通过观察症状实体,发现症状可以切分为原子症状词、修饰词等八种成分,且成分的构成序列满足一定的规则。然后,利用词法分析系统和条件随机场模型对症状进行切分和成分标注。最后,把症状之间的关系抽取看作一个分类问题,选取症状成分的构成特征、词典特征以及通用特征作为分类算法的特征;基于多种分类算法训练模型,将症状间的关系分为上下位关系和非上下位关系。实验结果表明,当选用支持向量机算法,同时选用三类特征时,取得了最好的效果,准确率、召回率和F1值分别达到了82.68%、82.13%和82.40%。在此基础上,使用所提出的关系抽取算法,抽取了20 619条上下位关系,构建了具有上下位关系的症状知识库。 Since the hyponymy between symptoms has strong structural features, an automatic hyponymy extracting method based on symptom components was proposed. Firstly, it was found that symptoms can be divided into eight parts： atomic symptoms, adjunct words, and so on, and the composition of these parts satisfied certain constructed rules. Then, the lexical analysis system and Conditional Random Field （CRF） model were used to segment symptoms and label the parts of speech. Finally, the hyponymy extraction was considered as a classification problem. Symptom constitution features, dictionary features and general features were selected as the features of different classification algorithms to train the models. The relationship between symptoms were divided into hyponymy and non-hyponymy. The experimental results show that when these features are selected simultaneously, precision, recall and Fl-measure of Support Vector Machine （SVM） are up to 82. 68%, 82. 13% and 82.40%, respectively. On this basis, by using the above hyponymy extracting algorithm, 20619 hyponymies were extracted, and the knowledge base of symptom hyponymy was built.

作者王婷王祺黄越圻殷亦超高炬

机构地区华东理工大学信息科学与工程学院上海中医药大学附属曙光医院

出处《计算机应用》 CSCD 北大核心 2017年第10期2999-3005,共7页 journal of Computer Applications

基金国家863计划项目(2015AA020107) 国家科技支撑计划项目(2015BAH12 F01-05)~~

关键词上下位关系症状构成成分条件随机场关系分类支持向量机决策树朴素贝叶斯 hyponymy symptom component Conditional Random Field （CRF） relationship classification SupportVector Machine （SVM） decision tree Naive Bayesian （NB）

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1刘磊,曹存根,王海涛,陈威.一种基于“是一个”模式的下位概念获取方法[J].计算机科学,2006,33(9):146-151. 被引量：18
2郭玉峰,刘保延,周雪忠.SNOMED CT的语义关系与连接概念[J].中华中医药学刊,2008,26(10):2206-2209. 被引量：11
3黄毅,王庆林,刘禹.一种基于条件随机场的领域术语上下位关系获取方法[J].中南大学学报（自然科学版）,2013,44(S2):355-359. 被引量：5

二级参考文献16

1张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
2车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
3Miller G.WordNet:An On-line Lexical Database.International Journal of Lexicography,1990,3(4)
4Beeferman D.Lexical discovery with an enriched semantic network.In:Proceedings of the Workshop on Applications of Word-Net in Natural Language Processing Systems,ACL/COLING,1998
5Richardson S D,Dolan W B,Vandervende L.Mindnet:acquiring and structuring semantic information from text.In:Proc.of COL-ING-ACL'98,1998.1098～1102
6Cao Cungen,Shi Qiuyan.Acquiring Chinese Historical Knowledge from Encyclopedic Texts.In:Proceedings of the International Conference for Young Computer Scientists,2001.1194～1198
7Dolan W,Vanderwende L,Richardson S D.Automatically Deriving Structured Knowledge Bases From On-Line Dictionaries.In:Proceedings of the Pacific Association for Computational Linguistics.Vancouver,British Columbia,1993.5～14
8Shinzato K,Torisawa K.Acquiring hyponymy relations from web documents.In:Proceedings of HLT-NAACL 2004.73～80
9宋柔许勇.基于语义的百科辞典知识提取实验[J].Computational Linguistics and Chinese Language Processing,2002,7(2):101-112.
10Hearst M A.Automatic acquisition of hyponyms from large text corpora.In:Proceedings of the 14th International Conference on Computational Linguistics.Nantes,France,1992

共引文献30

1成福春,刘华,房敏.基于SNOMED术语编码两节点之间多路径算法的实现及其对中医术语编码的意义[J].中国中医药图书情报杂志,2014,38(1):9-13. 被引量：4
2余蕾,曹存根.基于Web语料的概念获取系统的研究与实现[J].计算机科学,2007,34(2):161-165. 被引量：6
3姜琳,李宇,卢汉,曹存根.地理实体概念及其位置关系的获取和验证[J].计算机科学,2007,34(12):151-156. 被引量：1
4吴昱明,曹存根.一种介词-动词模式的获取方法[J].计算机科学,2008,35(11):139-143. 被引量：1
5陈建超,郑启伦,李庆阳,严桂夺.基于特征词关联性的同义词集挖掘算法[J].计算机应用研究,2009,26(7):2517-2519. 被引量：10
6陈建超,郑启伦,李庆阳,严桂夺.基于词序列频率有向网的中文组合词提取算法[J].计算机应用研究,2009,26(10):3746-3749. 被引量：6
7王盛,樊兴华,陈现麟.利用上下位关系的中文短文本分类[J].计算机应用,2010,30(3):603-606. 被引量：38
8刘兴林,陈建超,马千里.基于互联网的词汇语义知识库构建框架研究[J].计算机与现代化,2010(10):8-11. 被引量：1
9李丹亚,李军莲,李晓瑛,夏光辉,胡铁军.医学知识组织体系发展现状及研究重点[J].数字图书馆论坛,2012(12):12-20. 被引量：6
10范庆虎,昝红英,柴玉梅,张坤丽,贾玉祥.多资源融合的下位词发现[J].计算机工程与设计,2013,34(12):4310-4315. 被引量：1

同被引文献6

1黄毅,王庆林,刘禹.一种基于条件随机场的领域术语上下位关系获取方法[J].中南大学学报（自然科学版）,2013,44(S2):355-359. 被引量：5
2刘磊,曹存根,王海涛,陈威.一种基于“是一个”模式的下位概念获取方法[J].计算机科学,2006,33(9):146-151. 被引量：18
3马晓军,郭剑毅,线岩团,毛存礼,严馨,余正涛.结合词向量和Bootstrapping的领域实体上下位关系获取与组织[J].计算机科学,2018,45(1):67-72. 被引量：6
4孙佳伟,李正华,陈文亮,张民.基于词模式嵌入的词语上下位关系分类[J].北京大学学报（自然科学版）,2019,55(1):1-7. 被引量：10
5陈金栋,肖仰华.一种基于语义的上下位关系抽取方法[J].计算机应用与软件,2019,36(2):216-221. 被引量：9
6丁晟春,侯琳琳,王颖.基于电商数据的产品知识图谱构建研究[J].数据分析与知识发现,2019,3(3):45-56. 被引量：23

引证文献1

1邱科达,马建玲.基于文本语料的上下位关系识别研究综述[J].情报科学,2020,38(7):162-172. 被引量：2

二级引证文献2

1戴志宏,郝晓玲.上下位关系抽取方法及其在金融市场的应用[J].数据分析与知识发现,2021,5(10):60-70. 被引量：1
2王伟,梁继文,杨建林.基于引文网络的领域主题层次结构识别方法研究[J].图书情报工作,2022,66(17):81-92. 被引量：2

1孙宗明.某些线性变换的特征值与某些矩阵的特征值[J].泰安师专学报,2000,22(6):1-5.
2邓三鸿,傅余洋子,王昊.基于LSTM模型的中文图书多标签分类研究[J].数据分析与知识发现,2017,1(7):52-60. 被引量：27
3刘彤,黄修添,马建设,苏萍.基于完全联系的条件随机场的图像标注[J].计算机应用,2017,37(10):2841-2846. 被引量：5
4崔琳章.关于矩阵方程A^2=J解的分类问题[J].哈尔滨建筑工程学院学报,1989,22(1):126-130.
5李映华.切分(拼)圆柱的三种基本方法[J].数学小灵通（小学中高年级班）,2003(5):13-14.
6杨玉玲.面向二语教学的构式研究——以“V着也是V着”为例[J].国际汉语教育（中英文）,2017,2(3):82-89. 被引量：1
7胡晓东,高嘉伟.大数据下基于MapReduce的Dirichlet朴素贝叶斯文本分类算法[J].科技通报,2017,33(9):124-129.
8李雪松.基于微博粉丝特性提升高校图书馆移动服务[J].农业图书情报学刊,2017,29(10):184-188. 被引量：1
9闫璐瑶.浅议城市公共景观中艺术性构成的意义[J].小品文选刊（下）,2017,0(8):163-163.
10刘里,肖迎元.基于术语长度和语法特征的统计领域术语抽取[J].哈尔滨工程大学学报,2017,38(9):1437-1443. 被引量：6

计算机应用

2017年第10期

浏览历史

内容加载中请稍等...

基于症状构成成分的上下位关系自动抽取方法被引量：1

参考文献3

二级参考文献16

共引文献30

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于症状构成成分的上下位关系自动抽取方法 被引量：1

参考文献3

二级参考文献16

共引文献30

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于症状构成成分的上下位关系自动抽取方法被引量：1