期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于随机森林算法识别基因间长非编码RNA
1
作者 徐炜娜 张广乐 +6 位作者 李仕红 陈园园 李强 杨涛 许明敏 乔宁 张良云 《山东大学学报(理学版)》 CAS CSCD 北大核心 2019年第3期85-92,101,共9页
为了深入了解和探索lincRNA的调控机制,建立了lincRNA高效识别模型,有助于为后续研究提供数据源。依据最小自由能(minimum free energy, MFE)和信噪比(signal-noise ratio, SNR)等特征,并通过特征贡献度大小剔除冗余特征,构建随机森林(r... 为了深入了解和探索lincRNA的调控机制,建立了lincRNA高效识别模型,有助于为后续研究提供数据源。依据最小自由能(minimum free energy, MFE)和信噪比(signal-noise ratio, SNR)等特征,并通过特征贡献度大小剔除冗余特征,构建随机森林(random forest, RF)分类模型,有效地识别lincRNAs。经检验,模型的灵敏度、特异性和精确度分别达到94.1%、93.2%和93.7%,高于现有PhyloCSF、LncRNA-ID和CPC方法的各项识别指标。模型在识别过程中表现出较好的鲁棒性,可准确识别lincRNA。 展开更多
关键词 基因间长非编码RNA 随机森林算法 最小自由能 信噪比
原文传递
原核生物全基因组中16S rRNA基因的识别
2
作者 闫文凯 许明敏 +4 位作者 张广乐 乔宁 徐炜娜 陈园园 张良云 《微生物学报》 CAS CSCD 北大核心 2017年第10期1493-1503,共11页
【目的】识别原核生物全基因组中的16S rRNA基因。【方法】本文依据基因序列的GC碱基含量、碱基3-周期性和马尔可夫链3个方面的特性,构建了识别原核生物全基因组中16S rRNA基因的三层过滤模型。【结果】经检验,模型的特异性、敏感性和... 【目的】识别原核生物全基因组中的16S rRNA基因。【方法】本文依据基因序列的GC碱基含量、碱基3-周期性和马尔可夫链3个方面的特性,构建了识别原核生物全基因组中16S rRNA基因的三层过滤模型。【结果】经检验,模型的特异性、敏感性和马修斯相关系数分别为99.58%、91.60%和91.49%。【结论】结果表明,本文所提出的方法可以高效、准确地识别出16S rRNA基因。 展开更多
关键词 16S RRNA基因 GC碱基含量 碱基3-周期性 马尔可夫链
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部