生物文本中蛋白质名称的识别被引量：2

Protein Name Recognition from Biological Text

下载PDF

导出

摘要随着基因和蛋白质序列的发布和分子生物学研究的发展,其相关的数据呈指数级增长,因此如何从海量的相关文献中直接获取生物学家研究领域的相关信息变得迫在眉睫,识别生物文献中的命名实体如蛋白质、基因、脱氧核糖核酸名称等成为生物信息学中信息抽取的最基本任务。介绍了国际同类研究中生物命名实体识别的各种方法,重点介绍了蛋白质名称识别的相关方法、所用资源、实验结果及与国际同类研究的比较结果。 The genome sequence has ushered in a new era of rapid and exponential growth of data related to the biology community. Thus, there is a clear need in this area for automatic methods of extracting specific information directly relating to the interests of biology researchers. Name Entity（NE） such as protein, gene, DNA, etc. recognized from biological literature is a fundamental task in information extraction of bioinformatics. This paper introduces various methods of biological name entity recognition in international research on this area. Then the methods are presented with the relevant corpus and experiment resuits for protein name recognition. The promising results are gotten compared with the other state-of-the-art research.

作者王浩畅赵铁军于浩

机构地区哈尔滨工业大学计算机与技术学院

出处《计算机应用研究》 CSCD 北大核心 2007年第1期100-102,共3页 Application Research of Computers

基金国家自然科学基金资助项目(60302021)

关键词生物信息命名实体识别机器学习特征选择 Bioinformatics Name Entity Recognition Machine Learning Feature Selection

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Mika S,B Rost.Protein Names Peeled Precisely off Free Text[J].Bioinformatics,2004,20(Suppl 1):I241-I247.
2Franzen K,Eriksson G,Olsson F,et al.Protein Names and How to Find Them[J].Int J Med Inf,2002,67(1-3):49-61.
3K Fukuda,A Tamura,T Tsunoda,et al.Toward Information Extraction:Identifying Protein Names from Biological Papers[C].Proceedings of Pacific Symposium on Biocomputing,1998.707-718.
4T Ohta,Y Tateishi,H Mima,et al.The GENIA Corpus:An Annotated Research Abstract Corpus in the Molecular Biology Domain[C].Human Language Technologies Conference,2002.73-77.
5Tong Zhang,David E Johnson.A Robust Risk Minimization Based Named Entity Recognition System[C].Proceedings of CoNLL,2003.204-207.
6Tong Zhang,Fred Damerau,David E Johnson.Text Chunking Based on a Generalization of Winnow[J].Journal of Machine Learning Research,2002,(2):615-637.
7Radu Florian,Abe Ittycheriah,Hongyan Jing,et al.Named Entity Recognition Through Classifier Combination[C].Proceedings of CoNLL,2003.168-171.
8Tong Zhang.Large Margin Winnow Methods for Text Categorization[C].KDD Workshop on Text Mining,2000.81-87.
9Schwartz A,Hearst M.A Simple Algorithm for Identifying Abbreviation Definitions in Biomedical Text[J].Pacific Symposium on Biocomputing,2003,(8):451-462.
10Zhou G,Zhang J,Su J,et al.Recognizing Names in Biomedical Texts:A Machine Learning Approach[J].Bioinformatics,2004,20(7):1178-1190.

同被引文献51

1王浩畅,赵铁军,刘延力,于浩.生物医学文本中命名实体识别的智能化方法[J].北京邮电大学学报,2006,29(z2):54-58. 被引量：2
2徐健,张智雄.典型关系抽取系统的技术方法解析[J].数字图书馆论坛,2008(9):13-18. 被引量：3
3王浩畅,赵铁军.基于SVM的生物医学命名实体的识别[J].哈尔滨工程大学学报,2006,27(B07):570-574. 被引量：18
4邹霞.英语复合词的述谓结构与语义格研究[J].邵阳学院学报（社会科学版）,2007,6(3):89-91. 被引量：3
5Cohen AM,Hersh WR.A aurvey of current work in biomedical text mining[J].Brief Bioinform(S1467-5463),2005,6(1):57-71.
6Huang W,Nakamori Y,Wang S,et al.Mining scientific literature to predict new relationships[J].Intell Data Anal (S1088-467X),2005,9(2):219-234.
7Cohen KB,Hunter L.Getting started in text mining[J].PLoS Comput Biol(S1553-734X),2008,4(1):1-3.
8Ganiz MC,Pottenger WM,Janneck CD.Recent advances in literature based discovery[J/OL].http://dimacs.rutgers.edu/-billp/pubs/JASISTLBD.pdf.
9Mendonca EA,Cimino JJ.Automated knowledge extraction from MEDLINE citations[J].Proc AMIA Symp(S1531-605X),2000:575-579.
10Skusa A,Ruegg A,Kohler J.Extraction of biological interaction networks from scientific literature[J].Brief Bioinform(S1467-5463),2005,6(3):263-276.

引证文献2

1吴明智,崔雷.生物医学实体关系抽取的研究[J].中华医学图书情报杂志,2010,19(5):5-10. 被引量：5
2何林娜,杨志豪,林鸿飞,李彦鹏,唐利娟.基于特征耦合泛化的药名实体识别[J].中文信息学报,2014,28(2):72-77. 被引量：11

二级引证文献16

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：25
3李洋,于琦.基于科学计量方法的生物实体研究方案[J].中华医学图书情报杂志,2015,24(7):19-22.
4谷川,宋旭.体育赛事命名实体识别研究[J].河南师范大学学报（自然科学版）,2015,43(4):163-167. 被引量：1
5王莉,刘大鹏,佟铁.网络文本中文药名实体识别[J].辽宁科技大学学报,2015,38(2):127-130. 被引量：1
6隋明爽,崔雷.用文本挖掘方法发现药物的副作用[J].中华医学图书情报杂志,2015,24(11):67-72. 被引量：4
7隋明爽,崔雷.结合多种特征的CRF模型用于化学物质–疾病命名实体识别[J].现代图书情报技术,2016(10):91-97. 被引量：9
8闵波,张莉,张云宏,杨帆,许文娟.基于时间加权的生物医学文献知识发现的应用模型[J].情报学报,2017,36(6):574-577. 被引量：2
9潘璀然,施维,薛均,王青华,王理,董建成.生物医学命名实体识别研究现状及中文生物医学命名实体识别难点与意义综述[J].医学信息学杂志,2018,39(3):53-59. 被引量：5
10杨红梅,李琳,杨日东,周毅.基于双向LSTM神经网络电子病历命名实体的识别模型[J].中国组织工程研究,2018,22(20):3237-3242. 被引量：40

1小刘.如何根据名称识别计算机病毒[J].网络与信息,2005,19(1):49-49.
2邱莎.几种基于机器学习的生物命名实体识别模型比较[J].电脑知识与技术,2007(3):1385-1387.
3如何根据名称识别计算机病毒[J].计算机与网络,2004,30(12):53-53.
4彭春艳,张晖,包玲玉,陈昌平.基于条件随机域的生物命名实体识别[J].计算机工程,2009,35(22):197-199. 被引量：17
5张向喆,王明辉,赵洪波,王起山,潘玉春.生物医学文本中命名实体识别研究[J].上海交通大学学报（农业科学版）,2010,28(2):132-139. 被引量：6
6唐凤仙,钱沄涛.在线生物文献MRI图像识别系统的设计与实现[J].计算机工程与设计,2012,33(5):1886-1889.
7彭春艳,张晖,包玲玉,陈昌平.基于生物医学文献的蛋白质关系发现[J].电脑知识与技术,2008,3(12):1719-1720.
8戴兴虎,钱沄涛,唐凤仙,居斌.基于图表标题信息的在线生物文献MRI图像检测[J].浙江大学学报（工学版）,2012,46(7):1307-1313.
9阴赤.浅谈根据名称识别计算机病毒[J].同煤科技,2005(4):21-22.
10李红涛,袁激光,金人超.一种多序列比对的局部优化算法[J].计算机工程与应用,2003,39(15):99-101. 被引量：3

计算机应用研究

2007年第1期

浏览历史

内容加载中请稍等...

生物文本中蛋白质名称的识别被引量：2

参考文献10

同被引文献51

引证文献2

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

生物文本中蛋白质名称的识别 被引量：2

参考文献10

同被引文献51

引证文献2

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

生物文本中蛋白质名称的识别被引量：2