基于生物医学文献挖掘的疾病-基因-药物关系抽取研究被引量：2

Research on disease-gene-drug relationship extraction based on biomedical literature mining

下载PDF

导出

摘要目的:从海量生物医学文献中挖掘疾病-基因-药物三者之间的关联关系,为精准医疗与靶向治疗提供依据。方法:利用词典与规则相结合的方法识别实体,利用共现法和关联规则找出疾病-基因-药物间的关联关系,对存在关联关系的实体所在的句子通过SemRep工具得到实体之间的语义关联关系,采用R语言建立关联图。结果:以肺癌疾病作为检索条件,将在PubMed中检索出的文献作为语料库,获取肺癌相关的基因和药物间的关联关系、语义关系等信息。结论:该方法能够有效提高实体关系抽取的准确率明显优于利用词典识别的方法。 Objective：Mining disease-gene-drug associations from biomedical literature can provide the basis for precision medicine and targeted therapy.Method：This paper uses dictionary and rules for entity recognition,and uses co-occurrence and association rules to find relationships of disease-gene-drug.The SemRep system is exploited to extract semantic relationships from sentences containing associated entities.R language is used to implement the association graph.Result：Using lung cancer literature from PubMed as input and returning the entity relationships,semantic relationships and other detailed information.Conclusion：The usage of both dictionary and rules for entity relationship extraction is obviously better than only using dictionary.

作者翟菊叶叶泽坤杨枢刘长青 ZHAI Ju - ye;YE Ze - kun;YANC Shu;LIU Chang - cjing(Bengbu Medical College, Bengbu 233030;Fudan University, Shanghai 200433;Hefei University of Technology,Hefei 230026 China)

机构地区蚌埠医学院卫生管理系复旦大学计算机科学技术学院合肥工业大学计算机科学与技术学院

出处《新余学院学报》 2018年第2期1-5,共5页 Journal of Xinyu University

基金国家自然科学基金项目"组合诱导Ci PSCs-NSC与DA神经元前体移植治疗帕金森病模型猪体内功能建立及调控机制研究"(81771381) 安徽高校省级自然科学一般研究项目"电子病历命名实体识别和实体关系抽取研究"(KJ2015B076by) 安徽高校人文社科重点项目"基于统计分析及多维关联规则挖掘的安徽省大学生手机依赖与身心健康关联性研究"(SK2017A0182)

关键词生物医学文献挖掘肺癌基因药物关系提取 biomedical literature mining lung cancer gene drug relationship identification

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1李智恒,杨志豪,林鸿飞.基于语义的疾病相关蛋白质知识抽取[J].山东大学学报（理学版）,2016,51(3):104-110. 被引量：2
2龚乐君,韦有兵,谢建明,袁志栋,孙啸.一种面向基因与疾病关系的文本挖掘方法[J].东南大学学报（自然科学版）,2010,40(3):486-490. 被引量：2
3王逯姚,任慧玲,李姣.面向肿瘤个体化用药的文献挖掘系统设计与实现[J].情报学报,2015,34(3):257-266. 被引量：2
4李满生,常乘,马洁,朱云平.基于机器学习的蛋白质相互作用文献挖掘方法研究进展[J].中国科学：生命科学,2016,46(11):1235-1248. 被引量：4
5魏星,胡德华,易敏寒,常雪莲,朱文婕,曲少玲,邓端英.乳腺癌基因药物网络模型的构建与分析[J].南方医科大学学报,2016,36(2):170-179. 被引量：2

二级参考文献38

1Fernandez J M,Hoffmann R,Valencia A.iHop webservices. Nucleic Acids Research . 2007
2Rebholz-Schuhmann D,Kirsch H,Arregui Met al.EBIMed—text crunching to gather facts for proteinsfrom Medline. Bioinformatics . 2007
3Muin M,Fontelo P.Technical development of PubMedinteract:an improved interface for Medline/PubMedsearches. BMC Med Inform Decis Mak . 2006
4Wain H M,Bruford E A,Lovering R Cet al.Guide-lines for human gene nomenclature. Genomics . 2002
5Swanson D R.Complementary structures in disjoint sci-ence literatures. Proceedings of the14th Annual In-ternational ACM SIGIR Conference on Research andDevelopment in Information Retrieval . 1991
6Sinilnikova O M,Antoniou A C,Simard Jet al.TheTP53Arg72Pro and MDM2 309G>T polymorphismsare not associated with breast cancer risk in BRCA1andBRCA2mutation carriers. British Journal of Cancer . 2009
7AM Cohen,WR Hersh.A survey of current work in biomedical text mining. Briefings in Bioinformatics . 2005
8Honrado,E,Benitez,J,Palacios,J.Histopathology of BRCA1- and BRCA2-associated breast cancer. Critical Reviews in Oncology Hematology . 2006
9A. Seth D. Palli J. M. Mariano R. Metcalf M. C. Venanzoni S. Bianchi4 S. D. Kottaridis5 and T. S. Papas strong>b.p53 gene mutations in women with breast cancer and a previous history of benign breast disease. European Journal of Cancer . 1994
10Sunpaweravong S,Sunpaweravong P.Recent developments in critical genes in the molecular biology of breast cancer. Asian Journal of Surgery . 2005

共引文献7

1蒋艳辉,姚靠华,周双文,王薇.一种基于领域本体的药品研发信息抽取方法[J].情报杂志,2012,31(12):130-134. 被引量：4
2林帆,陈应坚,廖苑君,孙胜南,赵小蕾,覃继恒,饶绍奇.基于Newman网络分解算法的卵巢癌功能模块识别[J].国际遗传学杂志,2018,41(6):445-453. 被引量：1
3沈陆,吴茜,韦雨琦,贺林,秦胜营.BDA1型短趾症中的IHH信号通路[J].中国科学：生命科学,2017,47(4):403-408.
4王钟悦,王元君,余小康,贾晓梦,张晨.基于特征提取以及SVM的HIV-1蛋白酶抑制剂剪切特异性预测[J].科学与信息化,2017,0(2):195-196.
5范少萍,安新颖.基于多属性规则的生物医学语义关系研究[J].数字图书馆论坛,2021(1):18-23. 被引量：2
6池慧,任慧玲,刘懿.面向医学科技发展做好医学图书馆“十四五”规划[J].数字图书馆论坛,2021(5):31-36. 被引量：8
7唐詹,王龙鹤,郭旭超,周晗,刁磊,李林.基于深度学习的PPI关系抽取方法研究进展[J].计算机应用与软件,2023,40(5):1-9.

同被引文献14

1刘仲林.交叉科学时代的交叉研究[J].科学学研究,1993,11(2):9-16. 被引量：159
2刘洪星,王石林.Topic Maps与学科知识管理[J].计算机时代,2006(3):25-26. 被引量：6
3周俊生,黄书剑,陈家骏,曲维光.一种基于图划分的无监督汉语指代消解算法[J].中文信息学报,2007,21(2):77-82. 被引量：19
4佘俊,张学清.音乐命名实体识别方法[J].计算机应用,2010,30(11):2928-2931. 被引量：8
5姜文志,顾佼佼,丛林虎.CRF与规则相结合的军事命名实体识别研究[J].指挥控制与仿真,2011,33(4):13-15. 被引量：18
6刘丹.国内主题地图研究综述[J].图书情报工作,2012,56(5):62-66. 被引量：6
7杨彦波,刘滨,祁明月.信息可视化研究综述[J].河北科技大学学报,2014,35(1):91-102. 被引量：141
8何林娜,杨志豪,林鸿飞,李彦鹏,唐利娟.基于特征耦合泛化的药名实体识别[J].中文信息学报,2014,28(2):72-77. 被引量：11
9郭喜跃,何婷婷.信息抽取研究综述[J].计算机科学,2015,42(2):14-17. 被引量：84
10杨中国,李洪奇,朱丽萍,刘蔷.基于语义模式和引用分布的科技文献信息抽取[J].山东大学学报（理学版）,2015,50(3):11-19. 被引量：3

引证文献2

1代君,李佶壕,秦岩,王文欣.基于综述型文献的跨学科领域信息源地图绘制[J].图书情报知识,2018,35(6):61-74. 被引量：2
2任雪菁,安新颖,范少萍,张飞,黄裕翔.基于词典与CRF算法的中文生物医学实体自动标注平台建设[J].中华医学图书情报杂志,2020,29(9):29-35. 被引量：2

二级引证文献4

1卢洋,邓娅娟,王元地.期刊论文“中英文引文时滞差”现象及影响因素研究[J].中国科技期刊研究,2021,32(11):1455-1459. 被引量：2
2沈同平,俞磊.融合医学词典的条件随机场模型多文本实体识别研究[J].长春大学学报,2021,31(12):1-5.
3叶恩光,张晓如,张再跃,丁腊春,朱向南,王译.基于BERT和领域词典融合的中文电子病历命名实体识别[J].计算机与数字工程,2024,52(3):746-750. 被引量：1
4刘少俊,方延风.基于主题模型的网络信息源可视化分析研究[J].图书情报导刊,2019,4(3):32-39. 被引量：1

新余学院学报

2018年第2期

浏览历史

内容加载中请稍等...

基于生物医学文献挖掘的疾病-基因-药物关系抽取研究被引量：2

参考文献5

二级参考文献38

共引文献7

同被引文献14

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于生物医学文献挖掘的疾病-基因-药物关系抽取研究 被引量：2

参考文献5

二级参考文献38

共引文献7

同被引文献14

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于生物医学文献挖掘的疾病-基因-药物关系抽取研究被引量：2