期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
利用分组重量编码预测细胞凋亡蛋白的亚细胞定位 被引量:5
1
作者 张振慧 王正华 王勇献 《生物物理学报》 CAS CSCD 北大核心 2006年第4期275-282,共8页
从氨基酸的物化特性出发,利用物理学中“粗粒化”和“分组”的思想,提出了一种新的蛋白质序列特征提取方法——分组重量编码方法。采用组分耦合算法作为分类器,从蛋白质一级序列出发对细胞凋亡蛋白的亚细胞定位进行研究。针对Zhou和Doc... 从氨基酸的物化特性出发,利用物理学中“粗粒化”和“分组”的思想,提出了一种新的蛋白质序列特征提取方法——分组重量编码方法。采用组分耦合算法作为分类器,从蛋白质一级序列出发对细胞凋亡蛋白的亚细胞定位进行研究。针对Zhou和Doctor使用的数据集,Re-substitution和Jackknife检验总体预测精度分别为98.0%和85.7%,比基于氨基酸组成和组分耦合算法的总体预测精度提高了7.2%和13.2%;针对陈颖丽和李前忠使用的数据集,Re-substitution和Jackknife检验总体预测精度分别为94.0%和80.1%,比基于二肽组成和离散增量算法的总体预测精度提高了5.9%和2.0%。针对我们自己整理的最新数据集,通过Re-substitution和Jackknife检验,总体预测精度分别为97.33%和75.11%。实验结果表明蛋白质序列的分组重量编码对于细胞凋亡蛋白的定位研究是一种有效的特征提取方法。 展开更多
关键词 分组重量编码 凋亡蛋白 组分耦合算法
下载PDF
基于分组重量编码的蛋白质同源寡聚体分类研究
2
作者 张振慧 王正华 王勇献 《国防科技大学学报》 EI CAS CSCD 北大核心 2007年第2期91-93,共3页
基于一种新的特征提取方法——分组重量编码(Encoding on the basis of Grouped Weight,简记为EBGW),采用组分耦合算法作为分类器,从蛋白质一级序列出发对四类同源寡聚体蛋白进行分类研究。结果表明,在Jackknife检验下,基于分组重量编... 基于一种新的特征提取方法——分组重量编码(Encoding on the basis of Grouped Weight,简记为EBGW),采用组分耦合算法作为分类器,从蛋白质一级序列出发对四类同源寡聚体蛋白进行分类研究。结果表明,在Jackknife检验下,基于分组重量编码的分类方法总体分类精度达到70.92%,比基于氨基酸组成和加权伪氨基酸成分特征提取方法分别提高20.28和7.53个百分点,说明分组重量编码对于蛋白质同源寡聚体分类是一种高效的特征提取方法。 展开更多
关键词 分组重量编码 同源寡聚体 组分耦合算法
下载PDF
基于分组重量编码的蛋白质功能预测 被引量:1
3
作者 王秀鹤 王正华 +1 位作者 王勇献 张振慧 《生物信息学》 2007年第1期25-27,共3页
从蛋白质序列出发,采用分组重量编码(Encoding Based on Grouped Weight,简记EBGW),并结合最近邻居算法对蛋白质功能进行预测。对酵母(Saccharomyces cerevisiae)蛋白质的1826条序列进行预测,整体预测准确率与其他基于序列信息的蛋白质... 从蛋白质序列出发,采用分组重量编码(Encoding Based on Grouped Weight,简记EBGW),并结合最近邻居算法对蛋白质功能进行预测。对酵母(Saccharomyces cerevisiae)蛋白质的1826条序列进行预测,整体预测准确率与其他基于序列信息的蛋白质功能预测方法相当。实验结果表明基于EBGW编码方案的新方法可有效地应用于蛋白质功能预测。 展开更多
关键词 分组重量编码 蛋白质功能预测 特征序列 最近邻居算法
下载PDF
基于分组重量编码和特征选择技术预测外膜蛋白
4
作者 南重汉 邹凌云 《第三军医大学学报》 CAS CSCD 北大核心 2013年第13期1366-1370,共5页
目的建立新的机器学习模型,从蛋白质数据集或全基因组蛋白质序列中预测外膜蛋白。方法采用分组重量编码和氨基酸组成计算蛋白质序列特征,采用F-score方法反向选择特征,采用支持向量机算法建立分类模型,在1 087条蛋白质序列构成的数据集... 目的建立新的机器学习模型,从蛋白质数据集或全基因组蛋白质序列中预测外膜蛋白。方法采用分组重量编码和氨基酸组成计算蛋白质序列特征,采用F-score方法反向选择特征,采用支持向量机算法建立分类模型,在1 087条蛋白质序列构成的数据集上进行测试,评价预测模型的敏感性、特异性和预测精度,在多个细菌的全基因组蛋白质中预测外膜蛋白。结果新的序列组合编码方法与SVM相结合,区分外膜蛋白和α螺旋跨膜蛋白、球状蛋白、非外膜蛋白的准确度分别达到94.7%、96.4%和94.6%,经特征选择之后,分类准确度分别提高到95.7%、96.9%和95.9%,且在基因组数据集中的预测结果与已知事实相符度高。结论该方法预测准确度优于其他基于序列特征的预测方法,可用于在基因组序列中预测和筛选新的外膜蛋白。 展开更多
关键词 外膜蛋白 分组重量编码 特征选择 支持向量机
下载PDF
基于功能域和分组重量编码为特征参数的蛋白酶预测
5
作者 樊玉才 胡秀珍 《内蒙古工业大学学报(自然科学版)》 2011年第2期116-122,共7页
基于功能域组分和分组重量编码特征提取预测参数,采用支持向量机的识别算法,在Jackknife检验下,蛋白酶的预测结果为89.9%,蛋白酶的6个类别的总预测结果为94.0%。预测结果表明,该方法是预测蛋白酶及其类别的有效工具。
关键词 蛋白酶 功能域 分组重量编码 支持向量机
下载PDF
加权K近邻算法在蛋白质功能预测中的应用
6
作者 贾伟峰 廖波 李希 《微计算机信息》 2010年第36期172-173,共2页
针对蛋白质序列与所属类别往往是多对多的关系,提出了一种新的基于加权K近邻(KNN)的蛋白质功能预测算法。该算法从蛋白质序列出发,与分组重量编码(Encoding Based on Grouped Weight,简记为EBGW)相结合,并为未知蛋白质序列的近邻赋予一... 针对蛋白质序列与所属类别往往是多对多的关系,提出了一种新的基于加权K近邻(KNN)的蛋白质功能预测算法。该算法从蛋白质序列出发,与分组重量编码(Encoding Based on Grouped Weight,简记为EBGW)相结合,并为未知蛋白质序列的近邻赋予一定的权重。对比实验的结果表明,此基于加权KNN的功能预测算法可有效的应用于蛋白质的功能预测。 展开更多
关键词 数据挖掘 分组重量编码 K近邻 权重
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部