摘要
一条蛋白质序列通常是用多种特征来表达的,因此使用简单的特征参数对蛋白质结构进行预测,得到的效果往往不尽人意。在前人使用过的预测β-发夹的特征参数基础上,将功能位点信息添加到特征参数中,共同输入到支持向量机和随机森林两种算法,对4070条非冗余的蛋白质链中的β-发夹模体进行了预测。支持向量机算法得到的预测精度80.2%,相关系数0.60;随机森林算法得到的预测精度83.3%,相关系数0.66。
A protein sequence is usually expressed in various features. For this reason, prediction the protein structure with simple feature parameters is unsatisfactory. The information of function is added to the feature parameters of used. The β - hairpins are predicted in 4070 non - redundant protein chains by using both algorithms with support vector machine and Random Forest, and obtained the overall prediction accuracy of 80.2% and 83.3%, with the Matthews Correlation Coefficient values of 0. 60 and 0. 66 respectively.
出处
《内蒙古工业大学学报(自然科学版)》
2012年第3期1-9,共9页
Journal of Inner Mongolia University of Technology:Natural Science Edition
基金
国家自然科学基金资助项目(30960090)
关键词
Β-发夹模体
随机森林算法
预测的二级结构信息
自相关函数
功能位点信息
β-hairpin motif
Random forest algorithm
Information of predictive secondary structure
autocorrelation function
Information of function site.