生物医学语义关系抽取方法综述被引量：9

A Review of Methods for Semantic Relation Extraction in Biomedical Field

下载PDF

导出

摘要深度学习在自然语言处理方面取得了显著成效,为生物医学领域的信息抽取带来新的研究范式。本研究旨在系统调研生物医学语义关系抽取方法、分析其发展历程,为深度学习方法的进一步运用提供基础和启示。通过检索Pub Med、Web of Science和IEEE数据库,以及Bio Creative、Sem Eval等重要测评网站,遴选出具有代表性的抽取方法,并从目的、方法、数据集和效果四个维度进行分析。经过系统梳理,可将生物医学语义关系抽取方法分为三个阶段:基于知识、传统机器学习和深度学习。将先验知识和领域资源恰当地融入到深度学习模型中,是进一步提升语义关系抽取效果的探索方向。 Deep-learning has made remarkable achievements in natural language processing （NLP）, and is bringing a new research paradigm to information extraction in biomedical field. This paper studies the extraction methods of biomedical semantic relations and analyzes its development progress and principles, which may serve as foundation for further application of deep learning. After retrieving relevant information from PubMed, Web of Science, IEEE, and other important websites such as BioCreative and SemEval, representative methods are selected and analyzed from four dimensions of purpose, approach, dataset and performance. Extraction methods of biomedical semantic relation can be divided into three stages： knowledge-based, traditional machine learning- based and deep learning-based. It is a new exploration effort to enhance the extraction effect of semantic relations by introducing prior knowledge and domain resources into deep learning model properly.

作者李芳刘胜宇刘峥

机构地区中国科学院文献情报中心中国科学院大学哈尔滨工业大学深圳研究生院

出处《图书馆论坛》 CSSCI 北大核心 2017年第6期61-69,共9页 Library Tribune

关键词语义关系抽取生物医学深度学习卷积神经网络自然语言处理 semantic relation extraction biomedicine deep learning convolutional neural networks natural language processing

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1孙茂松,刘挺,姬东鸿,穗志方,赵军,张钹,吾守尔.斯拉木,俞士汶,朱军,李建民,刘洋,王厚峰,吐尔根.依布拉音,刘群,刘知远.语言计算的重要国际前沿[J].中文信息学报,2014,28(1):1-8. 被引量：23
2陈钊,徐睿峰,桂林,陆勤.结合卷积神经网络和词语情感序列特征的中文情感分析[J].中文信息学报,2015,29(6):172-178. 被引量：48

二级参考文献61

1张钹.自然语言处理的计算模型[J].中文信息学报,2007,21(3):3-7. 被引量：17
2Tenenbaum J, Kemp C, Griffiths T, et al. How to Grow a Mind: Statistics, Structure, and Abstraction [J]. Science, 2011, (331): 1279 1285.
3Zhu J, Lao N, Xing E. Grafting-Light: Fast, Incre- mental Feature Selection and Structure Learning of Markov Networks[C]//Proceedings of SIGKDD Inter national Conference on Knowledge Discovery and Data Mining, 2010.
4Kim S, Xing E. Tree-guided Group Lasso for Multi task Regression with Structured Sparsity [C]//Pro- ceedings of International Conference on Machine Learning (ICML), 2010.
5Zhu J, Xing E, Zhang B. Laplace Maximum Margin Markov Networks [C]//Proceedings of International Conference on Machine Learning.(ICML) 1256 1263, 2008.
6Ganchev K, Gra a J, Gillenwater J, et ai. Posterior Regularization for Structured Latent Variable Models [J]. Journal of Machine Learning Research. 2010 (11) .. 2001-2049.
7AltunY, Tsochantaridis I, Hofmann T. Hidden Markov Support Vector Machines[C]//Proceedings of International Conference on Machine Learning (IC- ML), 2003.
8Poon H, Domingos P. Unsupervised Ontology Induc- tion from Text[C]//Proceedings of the Annual Meet- Computational Linguistics Cohen S, Smith N. Covariance in Unsupervised Learn- ing of Probabilistic Grammars[J]. Journal of Machine Learning Research, 2010(11) :3017-3051.
9Hinton G, Osindero S, Teh Y. A Fast Learning Al- gorithm for Deep Belief Nets[J]. Neural Computa- tion, 2006(18): 1527-1554.
10Bengio Y, Lamblin P, Popoviei D, et al. Greedy Lay er-Wise Training of Deep Networks[C]//Proceedings of Advances in Neural Information Processing Systems 19 (NIPS 2006): 153-160, MIT Press, 2006.

共引文献69

1耿立波,刘涛,俞士汶,孙茂松,杨亦鸣.当代机器语言能力的研究现状与展望[J].语言科学,2014,13(1):34-41. 被引量：9
2余传明,原赛,王峰,安璐.大数据环境下文本情感分析算法的规模适配研究:以Twitter为数据源[J].图书情报工作,2019,63(4):101-111. 被引量：13
3萧国政,高精鍊,双文庭,姬东鸿,郭婷婷,吴泓渺.词位重构与平行语言资源的再生性建设[J].中文信息学报,2014,28(6):95-100.
4俞士汶,朱学锋,耿立波.自然语言处理技术与语言深度计算[J].中国社会科学,2015(3):127-135. 被引量：21
5何锫,黄海,张远平.上下文无关文法的可视化描述[J].广州大学学报（自然科学版）,2016,15(1):8-12.
6杨震,杨宁,徐敏捷.面向物联网应用的人工智能相关技术研究[J].电信技术,2016,0(5):16-19. 被引量：31
7刘冬宁,邓春国,滕少华,张巍,梁路.基于轻语义λ-演算的汉语陈述句灵活语序研究[J].中文信息学报,2016,30(3):23-29. 被引量：1
8彭炜明,宋继华,王宁.汉语析句的形式化问题[J].中文信息学报,2016,30(3):30-35.
9胡泉,谢芳,李源,刘延申.基于复杂网络理论的汉语复句关系词搭配网的统计特征研究[J].中文信息学报,2016,30(4):56-64. 被引量：1
10袁书寒,向阳.词汇语义表示研究综述[J].中文信息学报,2016,30(5):1-8. 被引量：4

同被引文献111

1唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：41
2车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：115
3曾新红.《中国分类主题词表》的OWL表示及其语义深层揭示研究[J].情报学报,2005,24(2):151-160. 被引量：29
4贾君枝.《汉语主题词表》转换为本体的思考[J].中国图书馆学报,2007,33(4):41-44. 被引量：24
5王军,张丽.网络知识组织系统的研究现状和发展趋势[J].中国图书馆学报,2008,34(1):65-69. 被引量：35
6何莘,王琬芜.自然语言检索中的中文分词技术研究进展及应用[J].情报科学,2008,26(5):787-791. 被引量：25
7丁云轩,闫雷.数据挖掘软件SemRepr的评价[J].中华医学图书情报杂志,2008,17(6):71-75. 被引量：5
8王超,李楠,李欣丽,梁循.倾向性分析用于金融市场波动率的研究[J].中文信息学报,2009,23(1):95-99. 被引量：14
9宋鸿彦,刘军,姚天昉,刘全升,黄高辉.汉语意见型主观性文本标注语料库的构建[J].中文信息学报,2009,23(2):123-128. 被引量：10
10揭春雨,冯志伟.基于知识本体的术语定义(上)[J].术语标准化与信息技术,2009(2):4-8. 被引量：9

引证文献9

1孙月萍,侯丽,李姣.药物疾病语义关系语料库构建方法研究[J].医学信息学杂志,2018,39(6):47-52.
2陶俊.词表语义组织研究的演进(1998-2018)[J].图书情报工作,2018,62(21):140-148. 被引量：10
3晏归来,安新颖,范少萍,周永称.国外生物医学文本语料库分类及特点研究[J].医学信息学杂志,2018,39(10):74-80. 被引量：2
4薛蕊,马小宁,李平,杨连报.自然语言处理关键技术在智能铁路中的应用研究[J].铁路计算机应用,2018,27(10):40-43. 被引量：4
5关鹏举,曹春萍.基于BLSTM的临床文本实体关系抽取[J].软件,2019,40(5):159-162. 被引量：2
6蔡皎洁.AI中的文本信息抽取方法进展研究[J].湖北工程学院学报,2019,39(6):65-72. 被引量：3
7隗昊,周爱,张益嘉,陈飞,屈雯,鲁明羽.深度学习生物医学实体关系抽取研究综述[J].计算机工程与应用,2021,57(21):14-23. 被引量：2
8陈果,陈晶,肖璐.词汇语义链:领域分析视角下的词汇语义挖掘理论框架[J].情报理论与实践,2022,45(4):170-176. 被引量：3
9董鹏,李晓瑛,李军莲,唐小利.基于语义谓词优化的疾病因果关系发现[J].数字图书馆论坛,2022(11):19-25. 被引量：1

二级引证文献27

1邵璐.本体与元数据融合驱动的数字文化资源语义组织研究[J].图书馆界,2022(6):12-16. 被引量：1
2刘静羽,顾立平,王昉,王映雪,郭进京,黄金霞.国际大型词表开放共享协议分析与启示--以STKOS词表开放共享协议设计为例[J].图书馆杂志,2020,39(2):41-50. 被引量：1
3王晓光,侯西龙,程航航,夏生平.敦煌壁画叙词表构建与关联数据发布[J].中国图书馆学报,2020,46(4):69-84. 被引量：33
4王煜,邓晖,李晓瑶,邓逸川.自然语言处理技术在建筑工程中的应用研究综述[J].图学学报,2020,41(4):501-511. 被引量：14
5彭其渊,胡雨欣,鲁工圆.基于预警文本信息的调度命令智能生成模型[J].同济大学学报（自然科学版）,2020,48(9):1328-1335. 被引量：15
6李贞贞,钟永恒.基于中文专利的产业概念层次体系构建方法研究[J].情报杂志,2020,39(9):73-80.
7周文杰.知识资源的序化与数字人文的结构化知识资源基础——基于知识地图和认知结构学说的解析[J].情报资料工作,2020,41(6):79-87. 被引量：14
8任雪菁,安新颖,范少萍,张飞,黄裕翔.基于词典与CRF算法的中文生物医学实体自动标注平台建设[J].中华医学图书情报杂志,2020,29(9):29-35. 被引量：1
9林玉萍,郑尧月,郑好洁,张栋,王丛,李小棉,李颖玉,田智强.基于医学影像分割方法的多模态语料库构建[J].模式识别与人工智能,2021,34(4):353-360. 被引量：5
10祁天娇,冯惠玲.档案数据化过程中语义组织的内涵、特点与原理解析[J].图书情报工作,2021,65(9):3-15. 被引量：28

1奚斌,钱龙华,周国栋,朱巧明,钱培德.语言学组合特征在语义关系抽取中的应用[J].中文信息学报,2008,22(3):44-49. 被引量：16
2肖飞,綦星光.图像分割方法综述[J].可编程控制器与工厂自动化（PLC FA）,2009(11):77-79. 被引量：6
3亓幸.Creative声卡[J].电子科技,2000,13(17):37-38.
4SKY.CREATIVE VideoBiasterWebCamGoPlus评测手记[J].新浪潮．学网络,2001(6):85-86.
5女人的6大购表主张[J].时尚时间,2011(3):68-71.
6侯立华.图像分割方法综述[J].科技创新导报,2008,5(22):249-249. 被引量：8
7把CS4集体打包[J].中国摄影,2008,0(12):155-155.
8应用软件[J].个人电脑,2004,10(1):114-114.
9虚鸣.别人的资源我来用——PUB FTP构建图解[J].软件指南,2005(1):52-54.
10河南省工商“中原红盾”新浪微博发布厅正式上线[J].网友世界,2013(1):14-14.

图书馆论坛

2017年第6期

浏览历史

内容加载中请稍等...

生物医学语义关系抽取方法综述被引量：9

参考文献2

二级参考文献61

共引文献69

同被引文献111

引证文献9

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

生物医学语义关系抽取方法综述 被引量：9

参考文献2

二级参考文献61

共引文献69

同被引文献111

引证文献9

二级引证文献27

相关作者

相关机构

相关主题

浏览历史

生物医学语义关系抽取方法综述被引量：9