-
题名融合信息量差异和聚类精炼的多Motif识别
- 1
-
-
作者
王迎国
钟诚
-
机构
广西大学计算机与电子信息学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第9期1971-1976,共6页
-
基金
国家自然科学基金项目(61462005)资助
广西自然科学基金项目(2014GXNSFAA118396)资助
-
文摘
采用信息量差异扩展采样Markov链的排斥力函数,使排斥力的值增加,推动两条相互靠近的采样Markov链向不同的区域探索,使motif位置概率矩阵元素值得到更新,避免motif识别算法过早陷入局部最优解,以发现更多的候选motif;利用信息量对motif聚类精炼,以减少假阳性motif对算法结果的影响,提高识别结果的精度和召回率.模拟启动子序列和真实数据集ENCODE TF Chip-seq上的实验结果表明,与同类的多motif识别算法相比,本文算法获得更高的召回率和精度、识别出保守性高的motif和匹配更多真实的motif.
-
关键词
生物序列
多motif识别
排斥力
聚类精炼
GIBBS采样
-
Keywords
bio-sequences
multimotif recognition
repulsive force
cluster refine
Gibbs sampling
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-