期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
基于流式细胞术和K-mer分析的好好芭基因组大小估测 被引量:6
1
作者 马鹏举 周佳熠 +4 位作者 孙会改 马丹丹 高飞 周宜君 张根发 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第6期733-737,共5页
好好芭是一种重要的特种油料植物,具有极高的经济价值.由于好好芭基因组数据缺乏,导致其分子生物学研究进展相对缓慢.本研究以黄瓜和大豆作为内标,用流式细胞仪测定经碘化丙啶(PI)染色的内标细胞核和好好芭细胞核混合样品的PI荧光强度,... 好好芭是一种重要的特种油料植物,具有极高的经济价值.由于好好芭基因组数据缺乏,导致其分子生物学研究进展相对缓慢.本研究以黄瓜和大豆作为内标,用流式细胞仪测定经碘化丙啶(PI)染色的内标细胞核和好好芭细胞核混合样品的PI荧光强度,通过比较好好芭与内标细胞DNA含量峰值的倍数关系,计算好好芭的基因组大小.同时使用基于生物信息学的K-mer分析来估测好好芭的基因组大小.采用流式细胞术测得好好芭基因组大小约为774 Mb.Kmer分析表明,当K值分别为17、19、21时,相应的DNA峰值出现在128、125和123,因此估测jojoba基因组大小为777~794Mb.K-mer分布曲线有明显的杂合峰,说明jojoba基因组杂合度较高.本研究完成了对好好芭基因组大小的估测,可为好好芭基因组学研究提供参考. 展开更多
关键词 好好芭 流式细胞术 k-mer分析 基因组大小
下载PDF
基于流式细胞术和K-mer分析的银缕梅属(Parrotia C.A.Mey.)植物基因组大小测定 被引量:7
2
作者 张云燕 安宇 +5 位作者 林峰 马秋月 周翔宇 金亮 李朋富 王中生 《植物遗传资源学报》 CAS CSCD 北大核心 2021年第2期561-570,共10页
金缕梅科(Hamamelidaceae)银缕梅属(Parrotia C.A.Mey.)仅包含银缕梅(Parrotia subaequalis(H.T.Chang)R.M.Hao&H.T.Wei)和波斯铁木(Parrotia persica(DC.)C.A.Mey.)两种落叶阔叶乔木,其中银缕梅是我国华东地区特有的Ⅰ级濒危珍稀... 金缕梅科(Hamamelidaceae)银缕梅属(Parrotia C.A.Mey.)仅包含银缕梅(Parrotia subaequalis(H.T.Chang)R.M.Hao&H.T.Wei)和波斯铁木(Parrotia persica(DC.)C.A.Mey.)两种落叶阔叶乔木,其中银缕梅是我国华东地区特有的Ⅰ级濒危珍稀保护植物,属东亚第三纪孑遗成分;其姊妹种波斯铁木则间断分布于伊朗北部,属北极第三纪孑遗植物类群。本研究首次利用流式细胞术和K-mer分析方法对银缕梅属两姊妹种的基因组大小进行了测定,建立和优化了以萝卜(Raphanus sativus L.‘Saxa’)为内标、WPB(Woody plant buffer)为细胞核解离液的两种植物单倍体基因组的DNA含量(DNA C值)流式测定的适宜体系,旨在为金缕梅科银缕梅属植物的全基因组测序、基因组学研究、种质资源开发和利用以及物种保育等提供前期基础数据参考;同时也可为金缕梅科其他属、种的基因组大小测定提供借鉴。主要研究结果如下:(1)通过流式测定银缕梅基因组大小约为971.45±13.91 Mb,波斯铁木基因组大小约为890.52±24.69 Mb;(2)K-mer分析估测银缕梅基因组大小为951.70 Mb,杂合率为1.740%,重复序列比例为77.50%;波斯铁木基因组大小为858.50 Mb,杂合率为0.695%,重复序列占74.30%;(3)银缕梅属于高杂合和高重复基因组,波斯铁木则属于微杂合和高重复基因组。本研究的结果为银缕梅属植物后续基于DNA三代高通量测序技术的全基因组测序、组装及去冗余处理等工作提供了重要的数据参考。 展开更多
关键词 银缕梅 波斯铁木 基因组大小 流式细胞术 k-mer分析 基因组去冗余
下载PDF
基于优化k-mer频率的宏基因组聚类方法 被引量:1
3
作者 刘富 兰旭腾 +3 位作者 侯涛 康冰 刘云 林彩霞 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2018年第5期1593-1599,共7页
k-mer频率是进行宏基因组分类时的一种重要的数字特征,然而该特征的维数随参数k的增加呈指数增长,利用该特征进行宏基因组分类易陷入"维数灾难"。为解决此问题,本文提出了一种基于优化k-mer频率的宏基因组DNA序列聚类方法。首... k-mer频率是进行宏基因组分类时的一种重要的数字特征,然而该特征的维数随参数k的增加呈指数增长,利用该特征进行宏基因组分类易陷入"维数灾难"。为解决此问题,本文提出了一种基于优化k-mer频率的宏基因组DNA序列聚类方法。首先,提取DNA序列的kmer频率特征;其次,使用非负矩阵分解算法对DNA序列的k-mer频率特征进行优化;最后,利用模糊C均值算法进行聚类。将本文方法在包含有不同物种个数的模拟宏基因组数据上运行的结果表明,其能有效地克服现有宏基因组数据分类方法计算量大的缺点,且分类性能优于同类算法。 展开更多
关键词 计算机应用 模式识别与智能系统 k-mer 非负矩阵分解 模糊C均值 宏基因组
下载PDF
基于K-mer-SVM的piRNA预测 被引量:1
4
作者 李小林 黄世国 《福建农林大学学报(自然科学版)》 CSCD 北大核心 2016年第2期228-231,共4页
采用支持向量机(SVM)结合K-mer分布特征预测piRNA.利用多种生物的非编码RNA序列数据库,从中挑选出piRNA序列作为正样本,并以由该数据库构建的非piRNA序列作为负样本,将正样本和负样本构成的数据随机取出50%作为训练集,将剩余的数据作为... 采用支持向量机(SVM)结合K-mer分布特征预测piRNA.利用多种生物的非编码RNA序列数据库,从中挑选出piRNA序列作为正样本,并以由该数据库构建的非piRNA序列作为负样本,将正样本和负样本构成的数据随机取出50%作为训练集,将剩余的数据作为测试集;提取正样本和负样本序列的K-mer分布特征构建特征矩阵;用SVM对其进行分类,实现piRNA预测.结果表明K-mer-SVM在准确率、正例覆盖率、MCC和F测度等分类指标上均明显优于K-mer-LDA,说明K-merSVM是更好的piRNA预测算法. 展开更多
关键词 支持向量机 PIRNA k-mer 分类
下载PDF
一种改进的基于Hash算法及概率的k-mer索引方法 被引量:2
5
作者 史晓楠 徐澜 +1 位作者 徐丹丹 高慧慧 《通信电源技术》 2017年第3期70-72,74,共4页
文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式,然后使用该编码方案对k-mer碱基串进行编码,最后得到唯一的Hash值。根据k值的大小,建立相应长度的Hash表... 文章基于k-mer编码建立了Hash线性索引模型。其基本思想是统计碱基字符出现的频数,将字符进行哈弗曼编码以得到最短的字符编码方式,然后使用该编码方案对k-mer碱基串进行编码,最后得到唯一的Hash值。根据k值的大小,建立相应长度的Hash表,在每个Hash位置下以链表的形式挂接位置信息,从而建立了索引模型。提出一种将四叉树进行编码压缩的索引方案——"线性Hash编码索引模型",消除了四叉树索引模型中父节点内存浪费问题。同时,查询速度从树形的O(log4n)降到了线性的0(1),得到很大地提高。 展开更多
关键词 k-mer 树形索引 Hash索引 哈弗曼编码 概率模型
下载PDF
软件实验DNA k-mer index四字链表字典树检索算法
6
作者 王辉 于立君 +2 位作者 张旭 高菁 魏智红 《实验室科学》 2018年第1期81-84,共4页
针对软件实验中常涉及到的DNA碱基序列k-mer 问题,提出一种基于四字链表字典树的快速检索算法。根据不同的k值建立深度为k的四字字典树,最大程度地避免字符串中重复公共前缀而造成的空间浪费,压缩内存消耗,降低空间复杂度;以叶子节点作... 针对软件实验中常涉及到的DNA碱基序列k-mer 问题,提出一种基于四字链表字典树的快速检索算法。根据不同的k值建立深度为k的四字字典树,最大程度地避免字符串中重复公共前缀而造成的空间浪费,压缩内存消耗,降低空间复杂度;以叶子节点作为k-mer 结束标志建立索引查询链表,并输出k-mer 的所有序列号与位置号,最终完成DNA序列k-mer 问题的建立索引与快速查找任务。实验表明,该算法具有很高的查找效率,且可以减少查询时间,能够高效解决DNA序列的k-mer index问题。 展开更多
关键词 k-mer问题 四字字典树 索引链表
下载PDF
基于流式细胞术和K-mer分析的荆芥基因组大小评估 被引量:2
7
作者 姜涛 刘灵娣 +2 位作者 田伟 刘铭 温春秀 《特产研究》 2023年第6期1-5,共5页
荆芥是我国常用大宗药材。为了研究荆芥基因组大小,本研究采用流式细胞术和K-mer分析方法对荆芥进行了基因组大小、GC含量、杂合度和重复序列评估。结果显示:基于流式细胞术,荆芥基因组平均大小为0.76Gb;采用K-mer分析显示,荆芥基因组... 荆芥是我国常用大宗药材。为了研究荆芥基因组大小,本研究采用流式细胞术和K-mer分析方法对荆芥进行了基因组大小、GC含量、杂合度和重复序列评估。结果显示:基于流式细胞术,荆芥基因组平均大小为0.76Gb;采用K-mer分析显示,荆芥基因组大小为0.903 Gb,GC含量为38.77%,杂合率约为0.32%,重复序列约为66.93%;荆芥基因组拼接组装后contig总长为792215707 bp,contig N50为960 bp,scaffold总长为813473842 bp,scaffold N50为1650 bp。本研究结合流式细胞术和全基因组调查结果,分析评估荆芥基因组大小在0.7~0.9 Gb之间,基因组序列重复比例较高。本研究对荆芥基因组进行了初步的探索,为荆芥的基因组学研究提供了参考依据。 展开更多
关键词 荆芥 流式细胞术 k-mer 基因组大小
下载PDF
基于流式细胞法和K-mer分析法检测沙鞭基因组大小 被引量:1
8
作者 刘涛 刘玉萍 +7 位作者 富贵 吕婷 刘峰 张雨 苏丹丹 王亚男 郑长远 苏旭 《草业学报》 CSCD 北大核心 2022年第12期133-145,共13页
禾本科沙鞭属仅包含沙鞭一个种。沙鞭具有根茎繁殖、克隆整合等典型沙生植物特征,是我国内蒙古高原非固定沙地的建群种。本研究采用流式细胞术和K-mer分析方法测定沙鞭基因组大小,建立和优化以芨芨草为内参物种、青海固沙草和方穗山羊... 禾本科沙鞭属仅包含沙鞭一个种。沙鞭具有根茎繁殖、克隆整合等典型沙生植物特征,是我国内蒙古高原非固定沙地的建群种。本研究采用流式细胞术和K-mer分析方法测定沙鞭基因组大小,建立和优化以芨芨草为内参物种、青海固沙草和方穗山羊草为外参物种的二倍体植物DNA含量(DNA C值)测定体系。研究结果表明:1)沙鞭流式细胞峰值荧光是青海固沙草的2。54倍,是芨芨草的1。35倍,峰值信号远小于方穗山羊草,推测沙鞭基因组大小约为1580。10±5。02 Mb;2)K-mer分析结果表明,沙鞭基因组大小为1563。54 Mb,杂合率1。15%,重复序列比例为66。27%,基因组GC含量为43。4%,属于高杂合、高重复的复杂基因组;3)沙鞭基因组可使用PacBio平台CLR或HiFi模式进行三代测序,测序深度应不低于20×。沙鞭基因组大小的准确测定不仅补充了禾本科针茅族植物的DNA含量数据,同时也为沙鞭基因组测序、进化基因组研究、种质资源开发和利用以及遗传资源保护提供了数据参考,可为针茅族近缘物种基因组大小测定提供借鉴。 展开更多
关键词 基因组大小 DNA C值 流式细胞术 基因组survey测序 k-mer分析
下载PDF
基于最小完美哈希函数的K-mer计数算法 被引量:3
9
作者 徐菡 于长永 史劼 《中国电子科学研究院学报》 北大核心 2020年第5期435-441,448,共8页
在DNA序列中对长度为k的子序列K-mer进行计数是生物信息学分析的关键环节,为解决传统K-mer计数中出现的耗时长、内存占用量大的问题,文中提出一种基于最小完美哈希函数的K-mer计数算法。该算法能够无哈希冲突地将K-mer映射到尽可能最小... 在DNA序列中对长度为k的子序列K-mer进行计数是生物信息学分析的关键环节,为解决传统K-mer计数中出现的耗时长、内存占用量大的问题,文中提出一种基于最小完美哈希函数的K-mer计数算法。该算法能够无哈希冲突地将K-mer映射到尽可能最小的整数范围内,对最小完美哈希表的查询在常数时间内完成,能够高效处理动态变化的大规模数据集。在处理大肠杆菌基因序列时,本文算法MPH-KMC相对jellyfish2算法,耗时缩短3倍,内存消耗缩小11倍。 展开更多
关键词 最小完美哈希函数 局部敏感哈希函数 k-mer频次统计 计数算法
下载PDF
基于k-mer组分信息的系统发生树构建方法 被引量:4
10
作者 刘红梅 刘国庆 《生物信息学》 2013年第2期100-104,共5页
随着越来越多基因组的测序完成,基于全基因组的非比对的系统发生分析已成为研究热点。不同的生物物种或个体基因组之间的核酸组分不完全相同。遗传语言-DNA序列的信息很大程度上反映在其k-mer频数中。基于基因组序列k-mer频数的系统发... 随着越来越多基因组的测序完成,基于全基因组的非比对的系统发生分析已成为研究热点。不同的生物物种或个体基因组之间的核酸组分不完全相同。遗传语言-DNA序列的信息很大程度上反映在其k-mer频数中。基于基因组序列k-mer频数的系统发生树则从新的角度为我们提供物种之间的亲缘关系。本文定义基于k-mer频数的信息参数,并用它表征基因组序列,计算不同基因组之间信息参数的距离,用邻接法对84个病毒构建了系统发生树,发现构建的系统发生树很大程度上与已有的系统发生树相吻合。 展开更多
关键词 系统发生树 k-mer频数 距离矩阵
下载PDF
生物序列数据K-mer频次统计问题的算法
11
作者 张鑫鑫 陈波 +1 位作者 何继凌 徐云 《计算机系统应用》 2014年第4期121-124,158,共5页
生物序列的k-mer频次统计是生物信息处理中一个非常基础且重要的问题.本文针对多序列在对齐模式下,不同偏移处一段长度范围内的k-mer频次统计问题进行了研究.提出了一种逆向遍历k-mer计数算法BTKC.该算法能够充分利用长度的k-mer统计信... 生物序列的k-mer频次统计是生物信息处理中一个非常基础且重要的问题.本文针对多序列在对齐模式下,不同偏移处一段长度范围内的k-mer频次统计问题进行了研究.提出了一种逆向遍历k-mer计数算法BTKC.该算法能够充分利用长度的k-mer统计信息,快速得到长度的k-mer统计信息,从而避免了统计任意长度的k-mer频次信息时都需要对所有序列进行遍历.算法的时间复杂度分析及实验结果表明,相比于传统的前向遍历FTKC算法,BTKC算法性能提升非常明显,且其时间复杂度与k-mer长度的变化范围无关,非常适合于在k-mer长度变化范围较大的情况下使用. 展开更多
关键词 k-mer计数 频次统计 逆向遍历 生物信息处理
下载PDF
基于k-mer词频向量的九种DNA序列相似性计算方法比较分析 被引量:2
12
作者 张小丹 李喆 +3 位作者 卫泽刚 刘策 余凯哲 魏月华 《科学技术创新》 2023年第21期106-111,共6页
序列相似性计算是生物序列分析的前提和基础,传统的序列相似性分析方法需要借助双序列比对,如Needleman-Wunsch(NW)序列比对算法。面对海量序列数据,基于序列比对的相似性计算方法具有较高的时间复杂度。为快速得到序列间相似性,可以通... 序列相似性计算是生物序列分析的前提和基础,传统的序列相似性分析方法需要借助双序列比对,如Needleman-Wunsch(NW)序列比对算法。面对海量序列数据,基于序列比对的相似性计算方法具有较高的时间复杂度。为快速得到序列间相似性,可以通过提取序列k-mer信息,利用序列k-mer词频向量进行计算。本文从序列k-mer词频向量提取及基于k-mer词频向量的九种相似性计算方法进行了详细介绍,并用两种数据集进行了比较分析。实验结果表明,基于k-mer词频相似性计算方法比标准NW算法速度至少快103倍,但不同的k-mer词频计算方法得到的相似性与标准NW算法差别较大,相对而言,欧式距离在两个数据集的相似性结果与NW方法更接近,在计算大规模序列相似性时,可以作为优先选择的方法。 展开更多
关键词 非序列对比 k-mer词频 Needleman-Wunsch算法 序列相似性
下载PDF
Analysis method and algorithm design of biological sequence problem based on generalized k-mer vector
13
作者 LIU Wen-li WU Qing-biao 《Applied Mathematics(A Journal of Chinese Universities)》 SCIE CSCD 2021年第1期114-127,共14页
K-mer can be used for the description of biological sequences and k-mer distribution is a tool for solving sequences analysis problems in bioinformatics.We can use k-mer vector as a representation method of the k-mer ... K-mer can be used for the description of biological sequences and k-mer distribution is a tool for solving sequences analysis problems in bioinformatics.We can use k-mer vector as a representation method of the k-mer distribution of the biological sequence.Problems,such as similarity calculations or sequence assembly,can be described in the k-mer vector space.It helps us to identify new features of an old sequence-based problem in bioinformatics and develop new algorithms using the concepts and methods from linear space theory.In this study,we defined the k-mer vector space for the generalized biological sequences.The meaning of corresponding vector operations is explained in the biological context.We presented the vector/matrix form of several widely seen sequence-based problems,including read quantification,sequence assembly,and pattern detection problem.Its advantages and disadvantages are discussed.Also,we implement a tool for the sequence assembly problem based on the concepts of k-mer vector methods.It shows the practicability and convenience of this algorithm design strategy. 展开更多
关键词 vector space biological sequence k-mer algorithm design analysis method.
下载PDF
基于K-mer扭转角偏好的蛋白质结构类型预测
14
作者 万晓耕 《生物信息学》 2021年第1期35-46,共12页
蛋白质的序列、结构和功能多种多样。大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结构具有一定的影响。本文提出一种新的基于5-mer氨基酸扭转角统计偏好的蛋白质结构类型预测方法,该方法通过... 蛋白质的序列、结构和功能多种多样。大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结构具有一定的影响。本文提出一种新的基于5-mer氨基酸扭转角统计偏好的蛋白质结构类型预测方法,该方法通过PDB数据库中5-mer中间氨基酸的扭转角统计偏好来进行结构类型的预测。新方法可以通过计算机仿真实现对新蛋白质序列结构类型的快速预测,并通过两组随机抽取的CATH数据验证了新方法的有效性。 展开更多
关键词 蛋白质结构预测 分类 氨基酸序列 k-mer 扭转角
下载PDF
基于流式细胞法和基因组K-mer分析法检测漆树基因组大小
15
作者 郭晖 陈鹏 +3 位作者 郭欣怡 任俊澎 商慧颖 柏国清 《中国生漆》 2023年第3期51-54,共4页
漆树Toxicodendron vernicifluum(Stokes)F.A.Barkl.是我国重要的经济林木资源,在工业、药用、生态、文化等领域产生了积极的影响。本研究利用流式细胞技术和高通量测序技术对漆树基因组特征进行了初步研究。利用已知基因组大小的柳树(S... 漆树Toxicodendron vernicifluum(Stokes)F.A.Barkl.是我国重要的经济林木资源,在工业、药用、生态、文化等领域产生了积极的影响。本研究利用流式细胞技术和高通量测序技术对漆树基因组特征进行了初步研究。利用已知基因组大小的柳树(Salix matsudana Koidz)作为对照,利用流式细胞技术估算漆树基因组大小为538.90 Mb。利用高通量测序技术对漆树基因组进行K-mer分析,估算漆树基因组大小为605.9Mb,基因组杂合度为0.572%,重复序列约占71.4%,GC含量为37.2%。从基因组基本结构特征上看,漆树基因组属于高重复、高杂合的复杂基因组。利用获得的DNA序列数据,从头组装了一个大小为638.5Mb,contig N50长度为153bp的漆树基因组。本研究为漆树全基因组精细图谱的绘制和分子育种研究提供了重要的理论依据。 展开更多
关键词 漆树(Toxicodendron vernicifluum(Stokes)F.A.Barkl.) 基因组大小 流式细胞术 k-mer分析
下载PDF
中国龙船花基因组Survey分析
16
作者 涂绍强 柯玲俊 +2 位作者 蔡月琴 陆銮眉 余惠文 《亚热带植物科学》 CAS 2024年第3期214-219,共6页
中国龙船花Ixora chinensis是一种兼备药用与观赏价值的传统中药材,解析中国龙船花的基因组特征信息,可为其全基因组测序和药效成分生物合成的分子机制研究奠定理论基础。本研究利用Survey基因组测序技术,使用K-mer分析方法对中国龙船... 中国龙船花Ixora chinensis是一种兼备药用与观赏价值的传统中药材,解析中国龙船花的基因组特征信息,可为其全基因组测序和药效成分生物合成的分子机制研究奠定理论基础。本研究利用Survey基因组测序技术,使用K-mer分析方法对中国龙船花基因组特征信息展开评估,获得基因组重复度、杂合度以及GC含量等信息。Survey高通量测序获得Raw Data 47.63 Gb,过滤后Clean data 45.62 Gb。K-mer分析表明,基因组大小588.35 Mb,杂合度1.5598%,重复度64.49%,GC含量35.71%,中国龙船花基因组呈现高杂合度、高重复度、基因组庞大的特征。 展开更多
关键词 中国龙船花 高通量测序 基因组Survey k-mer分析 杂合度 重复序列
下载PDF
新疆沙冬青基因组调查测序与基因组大小预测 被引量:16
17
作者 王雪 周佳熠 +3 位作者 孙会改 禹瑞敏 高飞 周宜君 《植物遗传资源学报》 CAS CSCD 北大核心 2018年第1期143-149,共7页
新疆沙冬青是中国荒漠地区代表性常绿阔叶植物,属于第三纪孑遗植物。其极强的逆境耐受性受到了研究者的广泛关注,但由于缺乏基因组序列,分子生物学研究水平进展缓慢。本研究对新疆沙冬青进行了基因组调查测序,共得到65 Gb大小的双端测... 新疆沙冬青是中国荒漠地区代表性常绿阔叶植物,属于第三纪孑遗植物。其极强的逆境耐受性受到了研究者的广泛关注,但由于缺乏基因组序列,分子生物学研究水平进展缓慢。本研究对新疆沙冬青进行了基因组调查测序,共得到65 Gb大小的双端测序数据。结合基于K-mer分析和流式细胞分析的方法,预测基因组大小、杂合率和GC含量等特征,估计基因组大小为770~787 Mb。测序数据拼接构建得到contigs的N50为684 bp,总读长为0.538 Gb;进一步组装后scaffolds的N50为12.09 kb,总读长为0.602 Gb。对拼接数据进行SSR分子标记预测,共得到151858个SSR,其中二核苷酸重复单元比例最高为56.39%,在二核苷酸重复单元中,AT/TA组成形式占多数。本研究首次报道了荒漠植物新疆沙冬青的基因组特征,为后续基因组学研究提供参考。 展开更多
关键词 新疆沙冬青 基因组大小 流式细胞分析 k-mer分析 SSR分子标记
下载PDF
基于粗糙集的基因信号属性约简 被引量:4
18
作者 刘富 张潇 +1 位作者 侯涛 刘云 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第2期624-629,共6页
为了解决k-mer频率在对DNA片段进行识别的过程中耗时长、效率低等问题,采用粗糙集的属性约简理论对DNA片段中提取的k-mer数字特征进行有效的约简优化,并对30个微生物菌株的全基因组进行了信号约简实验,结果证明本文所用方法能将原始的... 为了解决k-mer频率在对DNA片段进行识别的过程中耗时长、效率低等问题,采用粗糙集的属性约简理论对DNA片段中提取的k-mer数字特征进行有效的约简优化,并对30个微生物菌株的全基因组进行了信号约简实验,结果证明本文所用方法能将原始的高维基因信号约简掉72.27%,准确率提升0.62%,运行时间缩短73.3%。 展开更多
关键词 计算机应用 属性约简 粗糙集 k-mer频率
下载PDF
DNA片段拼接中重复序列算法研究 被引量:2
19
作者 王磊 张祖平 陈建二 《计算机科学》 CSCD 北大核心 2006年第7期164-166,170,共4页
本文主要研究DNA片断拼接中重复序列信息识别算法。包含大量重复信息的DNA序列,其重构是大规模DNA片段拼接所面临的实际困难之一。针对目前大多数拼接算法对于重复段的处理采用效率较低的反复迭代算法的特点,提出了基于k-mer子串的重复... 本文主要研究DNA片断拼接中重复序列信息识别算法。包含大量重复信息的DNA序列,其重构是大规模DNA片段拼接所面临的实际困难之一。针对目前大多数拼接算法对于重复段的处理采用效率较低的反复迭代算法的特点,提出了基于k-mer子串的重复段分析方法,充分考虑了拼接中可能的分割点,设计与分析了识别重复序列并提高序列一致性的高效算法。 展开更多
关键词 生物信息学 片段拼接 重复片断 k-mer子串
下载PDF
原核生物大肠杆菌基因组序列形成核小体能力的预测
20
作者 陈冰 任松叶 +1 位作者 赵秀娟 蔡禄 《信阳师范学院学报(自然科学版)》 CAS 北大核心 2013年第2期204-207,300,共5页
以大肠杆菌基因组为研究对象,基于体外组装的核小体序列中k-mers频数信息,采用多样性增量结合二次判别算法对核心DNA和连接DNA进行分类预测,整体准确率和相关系数分别达到83.08%和0.619.对大肠杆菌、酵母和人类基因组中核小体定位序列... 以大肠杆菌基因组为研究对象,基于体外组装的核小体序列中k-mers频数信息,采用多样性增量结合二次判别算法对核心DNA和连接DNA进行分类预测,整体准确率和相关系数分别达到83.08%和0.619.对大肠杆菌、酵母和人类基因组中核小体定位序列与缺失序列中偏好的k-mers进行了比较,结果表明核小体缺失序列更为保守. 展开更多
关键词 大肠杆菌基因组 核小体定位 k-mers频数 多样性增量 二次判别
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部