期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于统计差表与加权投票的高精度剪接位点预测
1
作者 曾莹 陈渊 袁哲明 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2019年第5期496-503,共8页
基于机器学习的高精度剪接位点识别是真核生物基因组注释的关键.本文采用卡方测验确定序列窗口长度,构建卡方统计差表提取位置特征,并结合碱基二联体频次表征序列;针对剪接位点正负样本高度不均衡这一情形,构建10个正负样本均衡的支持... 基于机器学习的高精度剪接位点识别是真核生物基因组注释的关键.本文采用卡方测验确定序列窗口长度,构建卡方统计差表提取位置特征,并结合碱基二联体频次表征序列;针对剪接位点正负样本高度不均衡这一情形,构建10个正负样本均衡的支持向量机分类器,进行加权投票决策,有效解决了不平衡模式分类问题. HS^3D数据集上的独立测试结果显示,供体、受体位点预测准确率分别达到93.39%、90.46%,明显高于参比方法.基于卡方统计差表的位置特征能有效表征DNA序列,在分子序列信号位点识别中具有应用前景. 展开更多
关键词 剪接位点 位置特征 卡方统计差表 加权投票 支持向量机
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部