基于倒排索引结构的寻亲系统的设计被引量：1

Design of a tracing system based on inverted index

下载PDF

导出

摘要设计一种新型的数据存储结构和检索方法,以实现对短串联重复序列数据的合理存储和快速检索。对不同STR基因座位点设置不同的域;在不同的域中,构建倒排索引结构来存储STR基因座数据;在此基础上,构建了基于STR基因座数据相似度的检索排序算法。该方法有效解决了采用传统关系型数据库存储STR基因座数据时存在的检索效率低下、难以应对基因突变以及扩展性差等问题。采用文中提出的数据存储结构和检索算法,极大地提高了系统的检索性能和可扩展性。 In order to enable effectively storage and fast retrieval of the short tandem repeat （STR） data, this paper designed a novel data storage structure and a new retrieval method. Different fields were set for different STR loci. Inverted indexes were then built to store STR data in different fields. Finally, a retrieval algorithm was developed to rank the candidates according to the similarity of their STR data with the input STR data. The proposed method solved several problems of traditional methods that used relational database such as low retrieval efficiency, difficulty in dealing with genetic mutations and bad expansibility. The retrieval efficiency and expansibility of the system were largely improved by using the proposed data storage structure and retrieval method.

作者刘健宁玉文孙茂许浩李宝娟 LIU Jian;NING Yu-wen;SUN Mao;XU Hao;LI Bao-juan(Network Center,The Fourth Military Medical University,PLA,Xi＇an 710032,China;School of Medicine,The Fourth Military Medical University,PLA,Xi＇an 710032,China;Department of Military Biomedical Engineering,The Fourth Military Medical University,PLA Xi＇an 710032,China)

机构地区空军军医大学网络中心空军军医大学基础医学院空军军医大学军事生物医学工程学系

出处《信息技术》 2018年第10期73-76,共4页 Information Technology

基金陕西省工业科技攻关(2016GY-094)

关键词 STR 亲子鉴定倒排索引检索 STR paternity testing inverted index retrieval

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1工作犬DNA数据库管理系统[J].警察技术,2011(6):77-78. 被引量：1
2刘冰.基于数据库数据分析的DNA证据作用评价[J].刑事技术,2015,40(3):199-203. 被引量：8
3刘刚,刘丑生,李宁,韩旭,王静.我国荷斯坦种公牛个体识别和亲子鉴定DNA数据库的建立[J].农业生物技术学报,2013,21(9):1085-1092. 被引量：3
4高玉振,应斌武,吴谨,李英碧,张霁,侯一平,贾东涛.亲子鉴定数据管理系统软件的开发与应用[J].中国输血杂志,2002,15(4):282-283. 被引量：4
5巫家盛,张何,孙宏钰,袁红,曲春冰,李海霞.DNA亲缘关系数据分析管理系统的开发与应用[J].政法学刊,2010,27(2):102-104. 被引量：3

二级参考文献16

1蔡颖,黄创杰,相大鹏,许业莉,梁希扬,陈燕勤,苏建晖.小型实验室专用亲子鉴定管理软件的开发与应用[J].中国司法鉴定,2006(3):13-15. 被引量：1
2Committee on Identifying the Needs of the Forensic Sciences Community,Committee on Science,Technology,and Law,Committee on Applied and Theoretical Statistics,et al.Strengthening forensic science in the United States:a path forward[M].Washington DC:The National Academies Press,2009:38-39.
3Ginsberg J,Mohebbi MH,Patel RS,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009,457(7232):1012-1014.
4Annual statistics:NDNAD,2010 to 2011[EB/OL].[2015-01-10].https://www.gov.uk/government/publications/ndnad-biennialreport-2009-to-2011.
5Annual statistics:NDNAD,2011 to 2012[EB/OL].[2015-01-12].https://www.gov.uk/government/publications/ndnad-biennialreport-2009-to-2011.
6NDNAD annual statistics 2012 to 2013[EB/OL].[2015-01-12].https://www.gov.uk/government/publications/national-dnadatabase-annual-report-2012-to-2013.
7National DNA database:annual report,2013 to 2014[EB/OL].[2015-01-12].https://www.gov.uk/government/publications/national-dna-database-annual-report-2013-to-2014.
8Lazer D,Kennedy R,King G,et al.The parable of google flu:traps in big data analysis[J].Science,2014,343(6176):1203-1205.
9Fei Tian Dongxiao Sun Yuan Zhang.Establishment of paternity testing system using microsatellite markers in Chinese Holstein[J].Journal of Genetics and Genomics,2008,35(5):279-284. 被引量：9
10陈学权.刑事诉讼中DNA证据运用的实证分析——以北大法意数据库中的刑事裁判文书为对象[J].中国刑事法杂志,2009(4):105-111. 被引量：17

共引文献14

1王文娟.刑事诉讼视野下的法医物证应用[J].今日健康,2016,15(1):443-443.
2蔡颖,黄创杰,相大鹏,许业莉,梁希扬,陈燕勤,苏建晖.小型实验室专用亲子鉴定管理软件的开发与应用[J].中国司法鉴定,2006(3):13-15. 被引量：1
3巫家盛,张何,孙宏钰,袁红,曲春冰,李海霞.DNA亲缘关系数据分析管理系统的开发与应用[J].政法学刊,2010,27(2):102-104. 被引量：3
4施识帆,潘猛,冷锴,刘云.浅谈信息化技术在亲权鉴定中的应用[J].江苏卫生事业管理,2013,24(1):107-108. 被引量：1
5刘冰.现阶段我国DNA数据库发展的几个关键问题[J].刑事技术,2015,40(4):318-323. 被引量：19
6刘冰.DNA数据库数据挖掘应用研究[J].刑事技术,2015,40(5):345-352. 被引量：4
7张倩,鲁朝霞,李潇,段文元,克丙申.亲权指数和个体识别似然比计算软件的开发与应用[J].中国法医学杂志,2016,31(6):598-600. 被引量：1
8李振营,金国文,冯冬亮.“互联网+”时代DNA检验技术拓展应用思考[J].广州市公安管理干部学院学报,2017,27(3):16-18. 被引量：2
9王凤格,田红丽,易红梅,赵涵,霍永学,匡猛,张力科,吕远大,丁曼卿,赵久然.植物品种DNA指纹鉴定原理及其鉴定方案[J].分子植物育种,2018,16(14):4756-4766. 被引量：10
10徐鹏.电子信息在刑事侦查中应用的问题及其对策研究[J].科技资讯,2016,14(21):5-5.

同被引文献8

1宿雪,葛洪魁,杨微,崔士波,韩来聚,魏茂安.钻柱振动录井的研究现状及发展趋势[J].石油钻探技术,2009,37(5):15-19. 被引量：18
2唐青.基于Tuscany SCA的随书光盘数据库管理系统的设计与实现[J].计算机与现代化,2012(12):149-152. 被引量：2
3刘胜娃,李卫,张越.长庆钻井公司统一通信平台的设计与实现[J].物联网技术,2017,7(4):62-63. 被引量：4
4白丽丽,孙文峰,高金兰,李宏玉,任爽.基于多参数控制的钻井事故监测预警系统[J].化工自动化及仪表,2017,44(7):643-647. 被引量：7
5陈健,左秀然,杨国良.基于KETTLE的医院多源异构数据集成研究及分析[J].中国数字医学,2018,13(3):35-37. 被引量：8
6朱晓东,袁坤杰,王艳玲.基于隐马尔科夫模型的石油钻井事故预警方法[J].郑州大学学报（工学版）,2018,39(4):51-57. 被引量：4
7肖越,肖成龙,孙威.基于SOA的云计算模型框架研究[J].电脑知识与技术（过刊）,2017,23(7X):46-47. 被引量：3
8王若贤.基于大数据环境下学生管理系统的多源异构数据集成研究[J].电子世界,2018,0(20):26-27. 被引量：1

引证文献1

1刘胜娃,周雅洁,高翔,王敏.基于大数据技术的井下异常预警平台的设计与实现[J].物联网技术,2020,10(3):67-69. 被引量：6

二级引证文献6

1于兴军,景佐军,智庆杰,唐飞,秦羿涵,王辉,寻明,冉洋,范磊.自动化钻机向智能化发展的关键技术分析[J].石油矿场机械,2020,49(5):1-7. 被引量：12
2张健.石油钻井工程事故的预警技术探析[J].石油石化物资采购,2021(18):33-34.
3程雅琼.基于改进聚类算法的网络平台异常数据挖掘方法[J].长江信息通信,2022,35(4):38-40. 被引量：2
4朱玉高.基于大数据环境的海洋石油钻完井数据分析系统建构[J].粘接,2022(5):117-121. 被引量：1
5梅舜豪.钻井一体化智能系统研究及应用[J].石油化工自动化,2023,59(2):53-55.
6梅舜豪.基于人工智能的钻井工程异常预警系统研究及应用[J].石油化工自动化,2023,59(4):59-63.

1双牌县台办.双牌县台办借助新媒体帮助台属顺利寻亲[J].台湾工作通讯,2018,0(7):39-39.
2林俊,方宽.审计大数据下模糊匹配审计证据获取方法研究[J].计算机与数字工程,2018,46(4):758-763. 被引量：4
3郝世诚,刘岩,鲁涤,刘革新,袁丽.基因突变和稀有等位基因共存影响亲子关系分析1例[J].法医学杂志,2018,34(4):452-453. 被引量：1
4宋玉龙,吕晓波,余若其.铸造工艺SQL Server数据库系统设计[J].铸造技术,2018,39(8):1693-1695. 被引量：3
5胡志鹏,彭亦功.基于数据相似度的自适应半监督随机森林算法[J].微电子学与计算机,2018,35(7):117-121.
6赵永生.化工物料存储区防火安全管理工作探讨[J].管理观察,2018(13):19-20. 被引量：1
7于滨,刘鹏宇,陆丽丽,孙玉强,崔建伟.基于Zabbix的分布式数字化监控系统设计与实现[J].信息通信技术,2018,12(3):65-71. 被引量：11
8徐攀平,易敏,赵丽娟.多种方法排除两基因座不符的父子鉴定一例分析[J].赣南医学院学报,2018,38(8):816-817.
9严圣华,王昌达.关于异构型物联网重复数据有效清除仿真[J].计算机仿真,2018,35(5):444-447. 被引量：1
10应松.照相馆“馆主”点亮800忠魂回家路[J].金融经济,2018(7):66-68.

信息技术

2018年第10期

浏览历史

内容加载中请稍等...

基于倒排索引结构的寻亲系统的设计被引量：1

参考文献5

二级参考文献16

共引文献14

同被引文献8

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于倒排索引结构的寻亲系统的设计 被引量：1

参考文献5

二级参考文献16

共引文献14

同被引文献8

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于倒排索引结构的寻亲系统的设计被引量：1