期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
序列相似性网络聚类与蛋白质家族划分 被引量:2
1
作者 时逢宽 李炜疆 《食品与生物技术学报》 CAS CSCD 北大核心 2014年第1期98-103,共6页
图聚类法是利用蛋白质序列信息推断其家族分类的有力手段。对于蛋白质数据集中家族内外存在着如同许多超家族一样的复杂关系,图聚类法达到较好表现必须两因素,1)输入的相似性图需要包含有足够的用于分类的信息;2)需要稳健的算法以识别... 图聚类法是利用蛋白质序列信息推断其家族分类的有力手段。对于蛋白质数据集中家族内外存在着如同许多超家族一样的复杂关系,图聚类法达到较好表现必须两因素,1)输入的相似性图需要包含有足够的用于分类的信息;2)需要稳健的算法以识别被隐藏在相似性图中的模糊集团。作者测试模块度最优算法Contraction-Dilation(CD)算法,采用来自于Pfam中的具有高度序列差异的烯醇酶宗族作为测试数据集。结果表明使用CD算法在相关参数与相似性图比较恰当的情况下,得到聚类结果与Pfam中高度一致。该算法能在一般情况下,使用最佳参数附近较宽范围仍能表现出较好性能。 展开更多
关键词 图聚类 蛋白质家族 网络聚类
下载PDF
构建适用于蛋白质家族分类的相似性网络
2
作者 时逢宽 李炜疆 《工业微生物》 CAS CSCD 2015年第3期53-57,共5页
图聚类用于蛋白质分类问题可以获得较好结果,其前提是将蛋白质之间复杂的相互关系转化为适当的相似性网络作为图聚类分类的输入数据。本文提出一种基于BLAST检索的相似性网络构建方法,从目标蛋白质序列出发,通过若干轮次的BLAST检索逐... 图聚类用于蛋白质分类问题可以获得较好结果,其前提是将蛋白质之间复杂的相互关系转化为适当的相似性网络作为图聚类分类的输入数据。本文提出一种基于BLAST检索的相似性网络构建方法,从目标蛋白质序列出发,通过若干轮次的BLAST检索逐步从数据库中提取与目标蛋白质直接或间接相关的序列,构成关联集。关联集中序列之间的相似性关系即相似性网络,可作为图聚类算法的分类依据。对Pfam数据库中依直接相似关系难以正确分类的蛋白质的计算表明,按本文方法构建的相似性网络取得了比较满意的结果。 展开更多
关键词 相似性网络 图聚类 蛋白质家族分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部