期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于位置关联权重矩阵及DNA结构信息预测人类剪接位点 被引量:1
1
作者 张鹏飞 李前忠 +1 位作者 左永春 李涛 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第4期390-397,共8页
人类剪接位点的识别是当前研究的一个重要课题.根据人类剪接位点附近区域的保守性,以位置关联权重矩阵及DNA结构信息作为特征输入参数,应用支持向量机(SVM)对人类基因组中的供体端和受体端剪接位点做了预测.对于供体端,5-fold交叉检验... 人类剪接位点的识别是当前研究的一个重要课题.根据人类剪接位点附近区域的保守性,以位置关联权重矩阵及DNA结构信息作为特征输入参数,应用支持向量机(SVM)对人类基因组中的供体端和受体端剪接位点做了预测.对于供体端,5-fold交叉检验总体预测精度为92.55%,3-way data split检验总体预测精度为92.25%;受体端5-fold交叉检验总体预测精度为90.70%,3-way data split检验总体预测精度为89.87%. 展开更多
关键词 剪接位点 位置关联权重矩阵 DNA结构信息
下载PDF
基于位置关联权重矩阵及序列组分的多样性增量识别剪接位点 被引量:4
2
作者 李琴 张瑾 +3 位作者 骈聪 陈园园 李强 张良云 《生物物理学报》 CAS CSCD 北大核心 2014年第5期391-400,共10页
前体mRNA的剪接是真核基因表达的关键阶段,识别剪接位点对基因表达也起着至关重要的作用。作者用紧邻与非紧邻的位置关联权重矩阵及组成分的多样性增量得到的五维特征向量来表示序列,应用支持向量机对供体位点和受体位点进行识别。采用5... 前体mRNA的剪接是真核基因表达的关键阶段,识别剪接位点对基因表达也起着至关重要的作用。作者用紧邻与非紧邻的位置关联权重矩阵及组成分的多样性增量得到的五维特征向量来表示序列,应用支持向量机对供体位点和受体位点进行识别。采用5-fold交叉检验,得到供体和受体位点的马修斯相关系数分别为0.924和0.947,ROC曲线下面积分别为99.08%和99.54%。与一些传统方法相比,这一方法考虑了位点之间的相关性和序列的生物信息,表现出特征少、精度高等优点。 展开更多
关键词 位置关联权重矩阵 多样性增量 支持向量机 剪接位点
原文传递
基于序列柔性参数的大肠杆菌启动子的预测 被引量:1
3
作者 谢亚茹 董志飞 +2 位作者 杨佳赫 周小军 李前忠 《内蒙古大学学报(自然科学版)》 CAS 北大核心 2018年第6期620-628,共9页
以大肠杆菌K-12的启动子(Promoter)序列作为正集,编码区(Coding区)和基因间汇聚区(CON区)的序列作为两组对照负集建立数据库,分别对实验上确定的165条σ38、94条σ54及600条σ70启动子序列进行二联体位点的保守性分析,得到保守性参数随... 以大肠杆菌K-12的启动子(Promoter)序列作为正集,编码区(Coding区)和基因间汇聚区(CON区)的序列作为两组对照负集建立数据库,分别对实验上确定的165条σ38、94条σ54及600条σ70启动子序列进行二联体位点的保守性分析,得到保守性参数随位点的涨落.用单种柔性结构参数分别和各集的二联体位置关联权重矩阵构成对序列的打分函数,分别对三类数据集进行了检验.研究发现,在自洽检验中,算法对σ38、σ54启动子的预测准确性都达到98%,对σ70启动子的预测准确性也达到了88%.通过绘制ROC曲线,确定了三类数据集的十交叉检验的最佳阈值,该算法在最佳阈值下对σ38、σ70两类启动子的预测准确度(Ac)都达到了80%以上,其中算法对以σ70启动子序列为正集、编码区序列为负集的数据集(记为Prom-Coding数据集)的Ac为88%,而对以σ54启动子序列为正集、基因间汇聚区序列为负集的数据集(记为Prom-CON数据集)的Ac为76%、Prom-Coding数据集的Ac为87%.使用Jackknife法对σ38、σ54两类数据集进行检验,Ac都达到了80%以上. 展开更多
关键词 大肠杆菌K-12 二联体位置关联权重矩阵 保守性参数 柔性参数 ROC曲线
下载PDF
应用基于粒子群优化的支持向量机算法识别真核生物基因的RNA聚合酶II启动子序列 被引量:1
4
作者 张文 骈聪 +3 位作者 陈园园 张瑾 李琴 张良云 《生物物理学报》 CAS CSCD 北大核心 2015年第2期143-153,共11页
启动子是调节基因表达的重要元件,对其的研究对于阐明基因转录调控机制具有重要意义。作者依据RNA聚合酶Ⅱ启动子序列特性选取高效的特征提取方法,构建了基于粒子群优化的支持向量机(particle swarm optimization-support vector machin... 启动子是调节基因表达的重要元件,对其的研究对于阐明基因转录调控机制具有重要意义。作者依据RNA聚合酶Ⅱ启动子序列特性选取高效的特征提取方法,构建了基于粒子群优化的支持向量机(particle swarm optimization-support vector machine,PSO-SVM)新方法,用以识别真核生物基因RNA聚合酶Ⅱ启动子。结合5-折交叉检验方法,得到启动子-外显子、启动子-内含子和启动子-基因间序列的分类准确率分别为97.1%、96.7%和98.8%,其马修斯相关系数分别为0.962、0.934和0.976。结果说明,对比其它启动子识别方法,PSO-SVM方法更能有效地识别真核生物基因启动子。 展开更多
关键词 位置关联权重矩阵 粒子群优化 支持向量机 随机森林 极限学习机 启动子识别
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部