在线孟德尔人类遗传数据库数据挖掘的研究进展被引量：7

Review on the Research Progress of Mining of OMIM Data

导出

摘要在线孟德尔人类遗传数据库(OMIM)是描述人类遗传病及其相关基因的知识库,其词条包括疾病的临床特征、基因连锁分析、染色体定位以及动物模型等,是研究疾病与基因关系的重要依据。疾病表型的相似性可能提示分子之间的相互作用。进行表型比对将有助于预测疾病候选基因以及分析分子之间的关系。OMIM数据库采用文本描述疾病表型,并不适用于计算机分析。对OMIM数据进行标准化对于大规模比对和分析疾病的表型数据、建立表型与基因的对应关系具有重要的意义。研究者近期通过引入标准的医学语言系统,采用文本挖掘中的词频-逆文档频率技术以及用于文档分类的余弦定理方法,结合基因本体论及其比对方法,推动了OMIM数据挖掘的快速发展。本文总结了近年来OMIM数据标准化、表型相似性度量及数据挖掘研究的主要成果,并对其发展趋势进行了预测。 Online Mendelian Inheritance in Man （OMIM） is a knowledge source and data base for human genetic dis- eases and related genes. Each OMIM entry ineludes clinical synopsis, linkage analysis for candidate genes, chromo- somal localization and animal models, which has become an authoritative source of information for the study of the relationship between genes and diseases. As overlap of disease symptoms may reflect interactions at the molecular level, comparison of phenotypic similarity may indicate candidate genes and help to discover functional connections between genes and proteins. However, the OMIM has used free text to describe disease phenotypes, which does not suit computer analysis. Standardization of OMIM data therefore has important implications for large-scale comparison of disease phenotypes and prediction of phenotype-genotype correlations. Recently, standard medical language sys- tems, term frequency-inverse document frequency and the law of cosines for document classification have been intro- duced for mining of OMIM data. Combined with Gene Ontology and various comparison methods, this has achieved substantial successes. In this article, we have reviewed various methods for standardization and similarity comparison of OMIM data. We also predicted the trend for research in this direction.

作者李建华李哲人康雁李岭

机构地区东北大学中荷生物医学与信息工程学院四川大学生物治疗国家重点实验室

出处《生物医学工程学杂志》 EI CAS CSCD 北大核心 2014年第6期1400-1404,共5页 Journal of Biomedical Engineering

基金国家自然科学基金资助项目(81072899 61071213 81473446)

关键词疾病表型-基因型关系文本挖掘相似性比较候选基因分子通路 phenotype-genotype correlation text mining similarity comparison candidate gene molecular pathway

分类号 Q987 [生物学—遗传学]

引文网络
相关文献

参考文献2

1王志刚,谢丽芳,陈鑫,杨啸林,彭屹,张正国.基于语义的疾病表型相似性[J].生物信息学,2012,10(3):154-157. 被引量：1
2Chienming CHEN,Chihchia CHEN,Tsanhuang SHIH,Tunwen PAI,Chinhua-HU,Wenshyong TZOU.EFFICIENT ALGORITHMS FOR IDENTIFYING ORTHOLOGOUS SIMPLE SEQUENCE REPEATS OF DISEASE GENES[J].Journal of Systems Science & Complexity,2010,23(5):906-916. 被引量：1

二级参考文献51

1S. E. Andrew, Y. P. Goldberg, B. Kremer, et al., The relationship between trinucleotide (cag) repeat length and clinical features of huntington's disease, Nat. Genet., 1993, 4: 398-403.
2K. Kieburtz, M. MacDonald, C. Shih, et al.Trinucleotide repeat length and progression of illness in huntington's disease, J. Med. Genet., 1994, 31: 872-874.
3G. A. Singer and D. A. Hickey, Nucleotide bias causes a genomewide bias in the amino acid composition of proteins, Mol. Biol. Evol., 2000, 17: 1581-1588.
4F. Naumann, H. Muller-Hartmann, H. Deissler, and W. Doerfler, On the function of the cgg-binding protein, Gene Function and Disease, 2001, 2(2 3): 89-94.
5Sputnik. URL: http://espressosoftware.com/sputnik/index.html, 1994.
6G. Benson, Tandem repeats finder: A program to analyze dna sequences, Nucleic Acids Res., 1999, 27:573 -580.
7V. Parisi, V. De Fonzo, and F. Aluffi-Pentini, String: Finding tandem repeats in dna sequences, Bioinformatics, 2003, 19:1733- 1738.
8R. Kolpakov, G. Bana, and G. Kucherov, Mreps: Efficient and flexible detection of tandem repeats in dna, Nucleic Acids Res., 2003, 31: 3672-3678.
9Y. Wexler, Z. Yakhini, Y. Kashi, and D. Geiger, Finding approximate tandem repeats in genomic sequences, Recomb '04: Proceedings of the Eighth Annual International Conference on Resaerch in Computational Molecular Biology, 2004: 223-232.
10Msatfinder: Detection and characterisation of microsatellites. URL: http://www.genomics.ceh.ac.uk/msatfinder/, 2005.

同被引文献85

1夏文广,安长青,郑婵娟,张继先,黄敏,王喻,杨丰文,段璨,李正良,刘清泉,张伯礼.中西医结合治疗新型冠状病毒肺炎34例临床研究[J].中医杂志,2020,61(5):375-382. 被引量：268
2张晶晶,包新华.Rett综合征的致病基因MECP2的研究进展——MECP2的基因结构、功能及调控基因[J].北京大学学报（医学版）,2009,41(6):712-715. 被引量：2
3庞兴梅.PhysioNet信息资源解析及利用[J].医学信息学杂志,2010,31(7):28-30. 被引量：6
4顾鸣敏.人类遗传性疾病基因诊断的回顾与展望[J].诊断学理论与实践,2010,9(5):420-423. 被引量：7
5刘蓓,朱海燕,高永红,徐冰,朱陵群,陈立新.黄芪多糖对TNF-α诱导心脏微血管内皮细胞黏附分子基因转录及p38MAPK信号通路的影响[J].世界中医药,2011,6(3):263-265. 被引量：18
6张鑫,李敏,张学军.全基因组外显子测序及其应用[J].遗传,2011,33(8):847-856. 被引量：27
7郭丽丽,唐雪春.《伤寒论》、《金匮要略方论》中附子应用特点的文献研究[J].新中医,2011,43(11):108-109. 被引量：9
8宋修云,胡金凤,陈乃宏.神经细胞凋亡与脑缺血疾病[J].中国药理学通报,2012,28(3):307-310. 被引量：74
9刘龙涛,郭刚,吴敏,张文高.The Progress of the Research on Cardio-Vascular Effects and Acting Mechanism of Polydatin[J].Chinese Journal of Integrative Medicine,2012,18(9):714-719. 被引量：8
10金碧辉,汪寿阳,任胜利,刘雅娟.论期刊影响因子与论文学术质量的关系[J].中国科技期刊研究,2000,11(4):202-205. 被引量：230

引证文献7

1徐畅,王雪,郭鑫,李毅,赵船,侯跃芳.基于疾病数据库的文本挖掘工具对比研究[J].中华医学图书情报杂志,2018,27(6):10-15.
2方马一佳,万海同,潘璐佳,郑艳秋,何昱.基于网络药理学研究黄芪-红花药对抗脑缺血作用机制[J].中成药,2020,42(1):222-226. 被引量：19
3浦冬青,刘政,梁佳玮,周超,郝清智.基于网络药理学及分子对接探讨热毒宁注射液抑制新型冠状病毒肺炎炎症风暴机制[J].中药药理与临床,2020,36(4):12-17. 被引量：4
4张少伟,蒋艳凰.基因解读系统中遗传检测报告自动生成技术[J].计算机应用与软件,2021,38(2):37-42. 被引量：1
5王利勤,熊鸣峰,王腾宇,万海同,熊墨年,吴春红.基于网络药理学探讨附子甘草配伍治疗慢性心力衰竭的作用机制[J].实用中西医结合临床,2022,22(7):1-6.
6李杨,杜雷雷,许飞,李艺萱,乔恩.大数据与人工智能在医学领域的应用进展[J].协和医学杂志,2023,14(1):184-189. 被引量：14
7陈佳萍,李享,刘红旭,来晓磊.中医药治疗冠状动脉微血管疾病证治规律及作用机制研究[J].中西医结合心脑血管病杂志,2024,22(6):961-970. 被引量：1

二级引证文献39

1杜珍武,孙昊炎,石传楷,李庆宇,宋旸.大数据及精准医疗背景下医学研究生所面临的挑战及对策[J].中国实验诊断学,2023,27(10):1250-1253. 被引量：2
2张明宽,张荣鹏,朱丽.芪参通络复元汤加味治疗脑卒中恢复期(气虚血瘀型)的疗效及对脑血流动力学的改善作用[J].四川中医,2022,40(1):139-142. 被引量：3
3刘涛,赵灵丽,钟林江,戴静,曾钦,何勇志.基于网络药理学的复方当归注射液作用机制研究[J].成都大学学报（自然科学版）,2020,39(3):225-229. 被引量：8
4宋世雷,陈跃平,章晓云,李时斌,赖渝,周毅.五苓散治疗骨关节炎潜在分子机制及网络药理学与分子对接[J].中国组织工程研究,2021,25(20):3185-3193. 被引量：10
5朱慧渊,苗琦,王江,罗斌,万海同,王文瑄,董炳耀,肖生斌,党珊.网络药理学预测丹红有效组分配伍抗缺血性脑卒中的作用机制及相关实验研究[J].西安交通大学学报（医学版）,2021,42(3):474-483. 被引量：6
6张询,万娜,黄小英,罗晶,李怡,张雨恬,邱婷,伍振峰,杨明.芳香中药在抗新型冠状病毒肺炎(COVID-19)中的应用[J].中草药,2021,52(11):3408-3417. 被引量：17
7叶晓滨.黄芪配伍益气活血补血药对研究进展[J].河南中医,2021,41(8):1285-1290. 被引量：12
8冯劼,李培凤.23G PPV联合通脉糖眼明胶囊对PDR患者疗效及血清胰岛素相关因子的影响[J].国际眼科杂志,2021,21(9):1607-1611. 被引量：1
9吕品,李晓天.基于体外试验和网络药理学研究金银花抗炎抗菌活性及分子机制[J].中国现代应用药学,2021,38(14):1678-1685. 被引量：31
10朱金才,林燕茹,何海鑫,杨智峰,郄丽丽,韩德柱,赵春艳,张爽.针灸联合通脑复原汤在脑梗死恢复期治疗中的应用[J].中国社区医师,2021,37(36):93-94.

1张桂荣,王欣,姚平,吴山力,杨翰仪.基因多态性与临床[J].中国实验诊断学,2002,6(4):278-279.
2袁芳,周艳红,王佳.通过文本挖掘获取疾病相关功能信息[J].微计算机信息,2009,25(36):1-3. 被引量：3
3钟伟.基因可以预测疾病吗[J].方圆,2013(13):56-59.
4王志刚,谢丽芳,陈鑫,杨啸林,彭屹,张正国.基于语义的疾病表型相似性[J].生物信息学,2012,10(3):154-157. 被引量：1
5袁芳,王瑞春,管明祥,万学元,何国荣,周艳红.基于文本挖掘与功能相似性的疾病基因预测[J].计算机工程,2011,37(4):27-28. 被引量：2
6王泽,鲍贤豪,秦升.微小RNA在心血管疾病中的意义及临床应用[J].中国心血管病研究,2011,9(6):471-474. 被引量：5
7王宏,李春海.代表性差异分析技术及其应用[J].生物技术通讯,1998,9(3):236-238.
8PNAS：一种肿瘤抑制因子作用机理查明[J].现代生物医学进展,2013,13(20).
9思达.升级你的母乳喂养知识库[J].父母世界,2013(6):83-83.
10彭翠英,廖端芳,张佳,陈琳玲,李凯.单核苷酸多态性及其检测方法[J].中国生物学文摘,2005,19(1):17-19.

生物医学工程学杂志

2014年第6期

浏览历史

内容加载中请稍等...

在线孟德尔人类遗传数据库数据挖掘的研究进展被引量：7

参考文献2

二级参考文献51

同被引文献85

引证文献7

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

在线孟德尔人类遗传数据库数据挖掘的研究进展 被引量：7

参考文献2

二级参考文献51

同被引文献85

引证文献7

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

在线孟德尔人类遗传数据库数据挖掘的研究进展被引量：7