摘要
转录因子识别对于理解转录机制起着重要作用,转录因子根据DNA绑定域的结构可以分为四大类.随着数据库中新蛋白序列的快速增加,设计一个高通量、高准确率的分类器来预测新蛋白是否转录因子及其类别是非常重要的,提出了一个基于支持向量机的人类转录因子分类算法Cla_Factor. Cla_Factor使用蛋白域作为向量基来表示蛋白质序列,在此高维向量表示方法下利用支持向量机来对人类转录因子分类.通过对来自于Transfac, Swiss_Prot的数据进行交叉验证测试、推广能力测试,证明了Cla_Factor算法同其他算法相比,具有更高准确率、敏感性、特异性以及推广能力.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z3期279-283,共6页
Journal of Computer Research and Development
基金
国家"八六三"高技术研究发展计划基金项目(2006AA02Z329)
国家自然科学基金项目(60573093)