-
题名基于高通量测序的短序列生物数据压缩研究
被引量:2
- 1
-
-
作者
孟倩
-
机构
复旦大学计算机科学技术学院
-
出处
《计算机应用与软件》
2017年第4期22-27,98,共7页
-
文摘
高通量测序技术(NGS)的发展带来了测序数据量的极速增长,给数据的存储和传输带来了极大的压力。数据压缩技术是解决这个问题的重要方法。传统的压缩方法并没有很好地利用数据本身的特性。因此,计算机学者们关注于NGS测序数据专用的压缩方法。全面总结针对高通量测序技术产生的Fastq和Fasta数据的压缩算法,介绍了Fastq和Fasta数据的特点,总结了目前常用的压缩方法。并通过不同物种、不同测序平台、不同规模的测序数据对多个具有代表性的压缩工具进行测试,比较它们的压缩性能并且验证相应的工具特点,为研究人员提供工具选择指导或改善工具性能提供帮助。最后总结阐述短序列数据压缩工具存在的问题和发展趋势。
-
关键词
数据压缩
短序列数据压缩
高通量测序
-
Keywords
Data compression
Short-sequence data compression
Next-generation sequencing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名高通量DNA测序数据的生物信息学方法
被引量:3
- 2
-
-
作者
詹晓娟
姚登举
朱怀球
-
机构
黑龙江工程学院计算机科学与技术学院
哈尔滨理工大学软件学院
北京大学生物医学工程系
-
出处
《大数据》
2016年第2期76-87,共12页
-
基金
黑龙江省自然科学基金资助项目(No.F201313)
黑龙江省教育厅科学技术研究资助项目(No.12541124)
哈尔滨市科技创新(No.2013RFQXJ114)~~
-
文摘
高通量测序技术产生的DNA序列数据长度较短,而且数据量非常巨大。分析了高通量测序环境下大数据的挑战和机遇,总结并讨论了数据压缩、宏基因组数据序列拼接、宏基因组数据序列分析方面的算法和工具等研究成果。最后,展望了高通量测序下DNA短读序列数据研究的发展趋势。
-
关键词
高通量DNA测序
生物信息学
短读序列数据压缩
短读序列数据拼接
短读序列数据分析
-
Keywords
high-throughput DNA sequencing
bioinformatics
short read sequence data compression
short read sequence data splicing
short read sequence data analysis
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名改进的Prony算法在频谱估计中的应用
被引量:4
- 3
-
-
作者
张宇波
陈继瑞
任慧
-
机构
郑州大学电气工程学院
-
出处
《化工自动化及仪表》
CAS
北大核心
2011年第2期187-189,共3页
-
文摘
在对Prony算法分析与研究的基础上,将基于奇异值分解的总体最小二乘法引入Prony算法,并将该改进的Prony算法应用于频谱估计。改进的算法弥补了信号序列在伴随噪声干扰和数据序列较短的情况下,快速傅立叶变换的方法无法对信号频率进行有效提取的缺点,最后通过实验仿真证明了该改进的Prony算法在频谱估计中应用的有效性。
-
关键词
PRONY算法
总体最小二乘法
奇异值分解
快速傅立叶变换
短数据序列
-
Keywords
Prony algorithm
total least squares
singular value decomposition
fast Fourier transform
short data sequence
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-