期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于距离测定的蛋白质复合物识别算法 被引量:7
1
作者 李敏 王建新 陈建二 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第5期1318-1323,共6页
针对蛋白质相互作用网络聚类算法标识已知蛋白质复合物数量有限的问题,提出了一种新的基于距离测定的蛋白质复合物识别算法IPC-DM。该算法基于对已知复合物内蛋白质之间的最短距离一般不超过2的发现,利用新的种子-扩充模型,大大提高了... 针对蛋白质相互作用网络聚类算法标识已知蛋白质复合物数量有限的问题,提出了一种新的基于距离测定的蛋白质复合物识别算法IPC-DM。该算法基于对已知复合物内蛋白质之间的最短距离一般不超过2的发现,利用新的种子-扩充模型,大大提高了识别蛋白质复合物的准确性。基于酵母蛋白质相互作用网络的实验表明,算法IPC-DM较其他5种典型的蛋白质复合物识别算法MCODE、RNSC、CFinder、LCMA和DPClus具有更好的蛋白质复合物识别能力。 展开更多
关键词 计算机应用 蛋白质相互作用网络 蛋白质复合物 聚类算法
下载PDF
基于遗传算法的蛋白质复合物识别算法 被引量:8
2
作者 郑文萍 李晋玉 王杰 《计算机科学与探索》 CSCD 北大核心 2018年第5期794-803,共10页
蛋白质互作用网络是一种典型的复杂网络,呈现了明显的社区结构。网络中的社区对应于功能模块,通常被看作蛋白质复合物。蛋白质复合物识别对预测蛋白质功能,解释特定生物进程具有重要作用。基于种子节点扩展的图聚类方法在蛋白质复合物... 蛋白质互作用网络是一种典型的复杂网络,呈现了明显的社区结构。网络中的社区对应于功能模块,通常被看作蛋白质复合物。蛋白质复合物识别对预测蛋白质功能,解释特定生物进程具有重要作用。基于种子节点扩展的图聚类方法在蛋白质复合物识别中应用广泛。针对此类算法最终结果受种子节点的影响较大,并且在簇的形成过程中搜索空间有限等问题,提出了一种基于遗传算法的蛋白质复合物识别算法GAGC(genetic algorithm based graph clustering),其中个体表示聚类结果(类别之间可能存在重叠节点),以F-measure值作为种群进化的目标函数。算法采用IPCA(improvement development clustering algorithm)算法产生初始种群;针对初始种群,设计了染色体对齐方式以进行交叉操作产生下一代种群。通过与DPClus、MCODE、IPCA、Cluster One、HC-PIN、CFinder等经典算法的对比实验表明,GAGC算法能够扩大图聚类算法的搜索空间,提高解的多样性,进而提高蛋白质复合物检测的性能。 展开更多
关键词 蛋白质互作用网络 遗传算法 图聚类 蛋白质复合物
下载PDF
基于加权网络和局部适应度的蛋白质复合物识别算法 被引量:2
3
作者 刘翠翠 孙伟 《计算机应用研究》 CSCD 北大核心 2018年第8期2308-2310,2327,共4页
通常在蛋白质网络中挖掘稠密子图或模块来识别其中的蛋白质复合物,限制了其应用范围和识别的准确性。针对该问题,提出了一种基于加权网络和局部适应度的蛋白质复合物识别算法。该算法综合稠密子图的密度指标和模块性定义了新的局部适应... 通常在蛋白质网络中挖掘稠密子图或模块来识别其中的蛋白质复合物,限制了其应用范围和识别的准确性。针对该问题,提出了一种基于加权网络和局部适应度的蛋白质复合物识别算法。该算法综合稠密子图的密度指标和模块性定义了新的局部适应度函数,并基于边聚集系数构建加权的蛋白质网络,根据权值选择边,在加权蛋白质网络中将种子边不断聚类扩展,挖掘综合适应度最大的子图,从而识别出蛋白质复合物。在多个真实蛋白质网络中的实验表明,该算法能够有效提升蛋白质复合物识别的准确性。 展开更多
关键词 加权网络 适应度 蛋白质复合物识别 模块性
下载PDF
基于模糊蚁群的加权蛋白质复合物识别算法 被引量:1
4
作者 毛伊敏 刘银萍 胡健 《计算机应用研究》 CSCD 北大核心 2020年第5期1340-1348,共9页
针对蚁群融合FCM聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模糊蚁群的加权蛋白质复合物识别算法FAC-PC(algorithm for identifying weighted protein compl... 针对蚁群融合FCM聚类算法在蛋白质相互作用网络中进行复合物识别的准确率不高、召回率较低以及时间性能不佳等问题进行了研究,提出一种基于模糊蚁群的加权蛋白质复合物识别算法FAC-PC(algorithm for identifying weighted protein complexes based on fuzzy ant colony clustering)。首先,融合边聚集系数与基因共表达的皮尔森相关系数构建加权网络;其次提出EPS(essential protein selection)度量公式来选取关键蛋白质,遍历关键蛋白质的邻居节点,设计蛋白质适应度PFC(protein fitness calculation)来获取关键组蛋白质,利用关键组蛋白质替换种子节点进行蚁群聚类,克服蚁群算法中因大量拾起放下和重复合并过滤操作而导致准确率较低和收敛速度过慢的缺陷;接着设计SI(similarity improvement)度量优化拾起放下概率来对节点进行蚁群聚类进而获得聚类数目;最后将关键蛋白质和通过蚁群聚类得到的聚类数目初始化FCM算法,设计隶属度更新策略来优化隶属度的更新,同时提出兼顾类内距和类间距的FCM迭代目标函数,最终利用改进的FCM完成复合物的识别。将FAC-PC算法应用在DIP数据上进行复合物的识别,实验结果表明FAC-PC算法的准确率和召回率较高,能够较准确地识别蛋白质复合物。 展开更多
关键词 蛋白质相互作用网络 蚁群聚类算法 模糊C-means 适应度 蛋白质复合物
下载PDF
模拟鸽子优化过程的蛋白质复合物识别算法 被引量:2
5
作者 丁玉连 雷秀娟 代才 《计算机科学与探索》 CSCD 北大核心 2017年第8期1279-1287,共9页
蛋白质复合物的检测对人类了解细胞组织和疾病预测起着至关重要的作用。然而,当前的蛋白质复合物识别方法的准确率低,对噪音敏感等缺点导致其识别效果并不理想。提出了一种新的蛋白质复合物识别方法PIOC(pigeon-inspired optimization c... 蛋白质复合物的检测对人类了解细胞组织和疾病预测起着至关重要的作用。然而,当前的蛋白质复合物识别方法的准确率低,对噪音敏感等缺点导致其识别效果并不理想。提出了一种新的蛋白质复合物识别方法PIOC(pigeon-inspired optimization clustering)。该方法根据蛋白质复合物的特性提出了簇的紧密邻接点概念和附件对核心的附着度概念,基于这两个概念,PIOC通过模拟鸽子优化算法中鸽子寻找目的地的过程来识别蛋白质复合物;结合鸽子算法中先全局搜索再局部搜索的特性和蛋白质复合物的核心附件结构,先通过鸽子算法中地图罗盘操作的全局搜索形成蛋白质复合物的核心,再通过鸽子算法地标操作的局部搜索将附件蛋白质聚集到核心簇中形成蛋白质复合物。基于酵母蛋白质相互作用网络DIP上的实验表明,PIOC比当前其他的蛋白质复合物识别算法能更有效地识别蛋白质复合物。 展开更多
关键词 蛋白质相互作用(PPI) 鸽子优化算法 蛋白质复合物 聚类
下载PDF
蛋白质复合物识别算法综述 被引量:3
6
作者 汤希玮 《长沙大学学报》 2017年第5期19-23,共5页
蛋白质复合物对理解细胞功能和细胞组织原则具有重要作用.高通量技术识别蛋白质复合物仍然相当不成熟.计算方法识别蛋白质复合物能在很大程度上弥补实验方法的不足.为能给生物学家提供有价值的参考意见,匹配统计量评估方法被用于比较八... 蛋白质复合物对理解细胞功能和细胞组织原则具有重要作用.高通量技术识别蛋白质复合物仍然相当不成熟.计算方法识别蛋白质复合物能在很大程度上弥补实验方法的不足.为能给生物学家提供有价值的参考意见,匹配统计量评估方法被用于比较八种典型的计算方法.评估结果显示,各种计算方法识别出的复合物均能较好地匹配真实的复合物.同时,不同的算法又具有各自不同的优势和不足,这给蛋白质复合物识别算法研究提供了上升空间. 展开更多
关键词 蛋白质相互作用 蛋白质复合物 识别算法
下载PDF
一种新的基于多数据源的蛋白质复合物识别算法 被引量:2
7
作者 胡伟 汤希玮 《计算机与应用化学》 CAS CSCD 北大核心 2014年第4期451-456,共6页
蛋白质复合物是许多生物过程得以实现的基石。蛋白质相互作用数据中的假阳性和假阴性对各种识别蛋白质复合物的计算方法有不良影响。为了解决这一问题,1种新的蛋白质复合物识别算法(ICMDS,Identifying Complexes based on Multiple Data... 蛋白质复合物是许多生物过程得以实现的基石。蛋白质相互作用数据中的假阳性和假阴性对各种识别蛋白质复合物的计算方法有不良影响。为了解决这一问题,1种新的蛋白质复合物识别算法(ICMDS,Identifying Complexes based on Multiple Data Sources)被提出。该方法整合基因表达谱、关键蛋白质信息和蛋白质相互作用3种生物数据进行蛋白质复合物的挖掘。首先,ICMDS重新定义了2个相互作用的蛋白质之间的功能相似性(FS,Functional Similarity)。然后,ICMDS选择已知的关键蛋白质作为种子构建蛋白质复合物。为了消除冗余的复合物,ICMDS算法也设计了冗余过滤子程序。另外,ICMDS也使用非关键蛋白质作为种子并将之扩展为蛋白质复合物。实验结果表明ICMDS识别蛋白质复合物的能力明显优于其他计算方法。 展开更多
关键词 蛋白质相互作用网络 关键蛋白质 基因表达谱 蛋白质复合物识别算法
原文传递
基于强化学习的离散层级萤火虫算法检测蛋白质复合物
8
作者 张其文 郭欣欣 《计算机应用研究》 CSCD 北大核心 2024年第7期1977-1982,共6页
蛋白质复合物的检测有助于从分子水平上理解生命的活动过程。针对群智能算法检测蛋白质复合物时假阳/阴性率高、准确率低、种群多样性下降等问题,提出了基于强化学习的离散层级萤火虫算法检测蛋白质复合物(reinforcement learning-based... 蛋白质复合物的检测有助于从分子水平上理解生命的活动过程。针对群智能算法检测蛋白质复合物时假阳/阴性率高、准确率低、种群多样性下降等问题,提出了基于强化学习的离散层级萤火虫算法检测蛋白质复合物(reinforcement learning-based discrete level firefly algorithm for detecting protein complexes,RLDLFA-DPC)。引入强化学习思想提出一种自适应层级划分策略,动态调整层级结构,能有效解决迭代后期种群多样性下降的问题。在层级学习策略中个体向两个优秀层级学习,避免算法陷入局部最优。为了提高蛋白质复合物检测的精度,结合个体环境信息提出自适应搜索半径的局部搜索策略。最后,在酵母蛋白质的4个数据集上,与8种经典的蛋白质复合物检测方法进行对比,验证了该方法的有效性。 展开更多
关键词 蛋白质复合物 萤火虫算法 强化学习 层级学习策略 局部搜索策略
下载PDF
SIAP:一种蛋白质复合物识别分布式算法
9
作者 邓超 刘桂霞 +1 位作者 孙立岩 王荣全 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2020年第11期1710-1714,共5页
针对AP算法运算时间消耗过高,相似性矩阵参考度值影响聚类效果等问题,本文提出了一种基于Spark改进的AP算法,首先对无权的数据集应用融合的ECC(边聚集系数)和CD算法进行加权处理,并根据加权的结果设置相似性矩阵的参考度提高聚类精度,并... 针对AP算法运算时间消耗过高,相似性矩阵参考度值影响聚类效果等问题,本文提出了一种基于Spark改进的AP算法,首先对无权的数据集应用融合的ECC(边聚集系数)和CD算法进行加权处理,并根据加权的结果设置相似性矩阵的参考度提高聚类精度,并在Spark平台并行化改进AP算法减少运算时间。应用PPI数据,识别蛋白质复合物,并引入F值聚类评价指标对结果进行比较,实验结果表明:该算法在不同的PPI网络上均有较高的聚类精度优于clusterone等经典的聚类算法,并且提高了运行效率,有良好的扩展性。 展开更多
关键词 AP算法 Spark平台 PPI网络 蛋白质复合物 F值评价 ECC和CD加权 并行计算
下载PDF
基于蛋白质相互作用网络的蛋白质复合物和功能模块预测算法研究进展 被引量:1
10
作者 张锦雄 钟诚 《广西科学》 CAS 北大核心 2022年第2期221-240,共20页
蛋白质相互作用网络中的模块化结构通常对应于蛋白质复合物或者蛋白质功能模块。基于蛋白质相互作用网络预测蛋白质复合物和功能模块不仅有助于理解生命有机体的细胞生物过程,而且可为探讨疾病的发生、发展和治疗以及合理的药物开发提... 蛋白质相互作用网络中的模块化结构通常对应于蛋白质复合物或者蛋白质功能模块。基于蛋白质相互作用网络预测蛋白质复合物和功能模块不仅有助于理解生命有机体的细胞生物过程,而且可为探讨疾病的发生、发展和治疗以及合理的药物开发提供重要的基础。本文通过回顾近二十年来基于蛋白质相互作用网络的蛋白质复合物和功能模块预测算法研究的发展历程,按照静态蛋白质相互作用网络(SPIN)和动态蛋白质相互作用网络(DPIN)两个方向分别梳理预测算法所涉及的方法和技术,同时归纳常用的数据集并分析所面临的问题,为进一步研究提供有价值的参考。 展开更多
关键词 静态蛋白质相互作用网络 动态蛋白质相互作用网络 蛋白质复合物 功能模块 预测算法
下载PDF
采用隐马尔科夫模型的蛋白质复合物识别研究 被引量:2
11
作者 李鹏 罗爱静 +2 位作者 闵慧 谭荪怡 郭惠敏 《计算机科学与探索》 CSCD 北大核心 2021年第10期1980-1989,共10页
动态蛋白质网络的构建和复合物识别问题是生物信息学领域目前研究的热点。针对现有的算法在解决前述问题上的不足,提出了一种基于隐马尔科夫模型的蛋白质复合物识别算法(HMM-PC)。首先基于蛋白质的基因共表达特性构建初始蛋白质网络,然... 动态蛋白质网络的构建和复合物识别问题是生物信息学领域目前研究的热点。针对现有的算法在解决前述问题上的不足,提出了一种基于隐马尔科夫模型的蛋白质复合物识别算法(HMM-PC)。首先基于蛋白质的基因共表达特性构建初始蛋白质网络,然后利用蛋白质的共享功能注释、共享结构域和连接强度等信息来对网络进行加权,得到动态蛋白质网络。在此基础上,考虑前一时刻蛋白质网络拓扑结构信息对当前时刻蛋白质网络拓扑结构信息的影响,采用隐马尔科夫模型描述蛋白质复合物与网络个体间的相互关系,进而将动态蛋白质网络中的复合物识别问题建模为隐马尔科夫模型中的最优状态序列发现问题,并采用维特比算法识别得到蛋白质复合物。最后通过理论分析证明了所提算法的复杂度较低。采用DIP数据集和MIPS数据集中的酵母蛋白质网络作为测试对象,大量的仿真实验结果也表明,HMM-PC算法的鲁棒性较强,在查全率、查准率、F-measure和效率等方面的性能都要优于现有的复合物识别算法。 展开更多
关键词 动态蛋白质网络 蛋白质复合物 隐马尔科夫模型 状态序列 维特比算法
下载PDF
基于复合物参与度和密度的关键蛋白质预测 被引量:1
12
作者 毛伊敏 刘银萍 《计算机工程与科学》 CSCD 北大核心 2019年第10期1738-1748,共11页
针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性,蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的... 针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性,蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的识别准确率和特异性不高的问题,提出一种基于复合物参与度和密度的关键蛋白质预测算法PEC。首先融合GO注释信息和边聚集系数构造加权PPI网络,克服假阳性对实验结果的影响;基于蛋白质相互作用的边权重,构造相似度矩阵,设计特征值间的最大本征差值来自动确定划分数目K,同时根据加权网络中的蛋白质节点度来选取K个初始聚类中心,进而利用谱聚类结合模糊C-means聚类算法实现复合物的挖掘,提高聚类的准确率,降低数据的维数;其次基于蛋白质节点的复合物参与度以及节点邻域子图密度,设计出关键节点的关键性得分。在DIP和Krogan 2个数据集上,将PEC与DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10种经典算法相比,实验结果表明,PEC算法能够识别出更多的关键蛋白质,且聚类结果的准确率和特异性较高。 展开更多
关键词 蛋白质相互作用网络 谱聚类算法 蛋白质复合物 密度 关键蛋白质
下载PDF
基于最大期望算法的蛋白质交互关系识别
13
作者 蔡松成 牛耘 《计算机技术与发展》 2018年第8期48-52,共5页
针对基于远监督的方法中训练数据存在噪音的问题,采用了一种基于最大期望(EM)算法的多实例多标记的方法来进行蛋白质关系的抽取。首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,提取出签名档中的词法和语法等特征,... 针对基于远监督的方法中训练数据存在噪音的问题,采用了一种基于最大期望(EM)算法的多实例多标记的方法来进行蛋白质关系的抽取。首先通过对大规模生物医学文本的自动搜索建立目标蛋白质对的签名档,提取出签名档中的词法和语法等特征,作为蛋白质对签名档的向量空间模型(VSM);然后引入隐变量,将蛋白质对的签名档及其标签构建为多实例多标记学习模型,利用最大期望算法来迭代消除训练数据中的噪音;最后通过有监督的方法来预测未知蛋白质对的交互关系。针对蛋白质对描述中还存在的其他蛋白质名称会对交互关系的判断产生影响,改进了蛋白质对的特征表示。实验结果表明,该方法较原始的最大期望算法取得了更高且均衡的精确度和召回率。 展开更多
关键词 蛋白质交互 最大期望算法 多实例多标记 蛋白质实体识别
下载PDF
采用BP算法的多层感知机模型的蛋白识别 被引量:2
14
作者 张光亚 葛慧华 方柏山 《华侨大学学报(自然科学版)》 CAS 北大核心 2009年第2期161-165,共5页
采用误差反传(BP)算法的多层感知机模型,对嗜热蛋白和常温蛋白进行模式识别.通过增加训练数据及多种检验方法检验模型稳定性及泛化能力,探讨蛋白分子大小对识别效果影响.结果表明,当动态参数为0.2,学习速率为0.5,隐含层节点数为11时,该... 采用误差反传(BP)算法的多层感知机模型,对嗜热蛋白和常温蛋白进行模式识别.通过增加训练数据及多种检验方法检验模型稳定性及泛化能力,探讨蛋白分子大小对识别效果影响.结果表明,当动态参数为0.2,学习速率为0.5,隐含层节点数为11时,该模型在自一致性检验、交叉验证和独立样本测试3种检验方法中的识别精度分别为91.5%,88.2%和92.1%,其表现优于一些常见的模式识别算法,且具有良好的稳定性及泛化能力.此外,对于较大的或者中等大小蛋白质分子,其识别的精度都较高;而对于较小的蛋白分子,其识别效果较差. 展开更多
关键词 BP算法 多层感知机 模式识别 蛋白质 热稳定性
下载PDF
基于加权朴素贝叶斯分类器和极端随机树的蛋白质接触图预测 被引量:6
15
作者 金康荣 於东军 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2018年第5期619-628,共10页
提出一个新的基于集成学习的预测器(TargetPCM),对蛋白质接触图(特别是中长程)进行高精度的预测。首先,TargetPCM使用加权朴素贝叶斯分类器(Weighted Nave Bayes classifier,WNBC)融合3个接触图预测器的输出,其中WNBC中的权重参数通... 提出一个新的基于集成学习的预测器(TargetPCM),对蛋白质接触图(特别是中长程)进行高精度的预测。首先,TargetPCM使用加权朴素贝叶斯分类器(Weighted Nave Bayes classifier,WNBC)融合3个接触图预测器的输出,其中WNBC中的权重参数通过粒子群算法优化得到;其次,将WNBC融合后的输出和基于序列的特征进行组合,得到更具鉴别能力的特征;在此基础上,应用极端随机树训练得到最终的蛋白质接触图预测模型。为了验证TargetPCM的有效性,在包含98个非冗余蛋白质的数据集上进行了测试。结果表明:对于短程、中程和长程接触,TargetPCM的Top L/5精度比现有最好的集成预测器(NeBcon)分别提高了8.2%,16.1%和5.3%。在CASP11上进一步的验证表明,对于短程、中程和长程接触,TargetPCM的Top L/5精度比现有最好的基于协同进化的集成预测器(MetaPSICOV)分别提高了7.4%,9.1%和7.5%。实验结果验证了本文所提蛋白质接触图预测方法的有效性。 展开更多
关键词 模式识别与智能系统 蛋白质接触图 特征提取 加权朴素贝叶斯分类器 粒子群算法 极端随机树
下载PDF
基于TIGA_S4VM改进算法的蛋白质序列识别方法 被引量:2
16
作者 王晓峰 随婷婷 《山东大学学报(工学版)》 CAS 北大核心 2014年第1期1-6,共6页
针对安全的半监督支持向量机(safe semi-supervised support vector machine,S4VM)存在参数选择盲目性、正负样本比例不平衡等问题,建立了基于改进的TF-IDF(term frequency-inverse document frequency,TF-IDF)、遗传算法(genetic algor... 针对安全的半监督支持向量机(safe semi-supervised support vector machine,S4VM)存在参数选择盲目性、正负样本比例不平衡等问题,建立了基于改进的TF-IDF(term frequency-inverse document frequency,TF-IDF)、遗传算法(genetic algorithm,GA)和S4VM的蛋白质序列识别方法 TIGA-S4VM。利用改进的TF-IDF算法提取出蛋白质序列中的特征项,将各个特征项在蛋白质序列中出现的频率归一化后作为识别模型的特征值,并结合GA以及S4VM对蛋白质序列进行识别。实验结果表明,TIGA-S4VM优于其它5个识别方法,即使在训练样本率较低时,也能有效地识别蛋白质序列。 展开更多
关键词 支持向量机 安全的半监督支持向量机 蛋白质序列识别 遗传算法 半监督算法
原文传递
关于吉布斯采样算法识别MOTIF的研究
17
作者 李蕴奇 李小明 +1 位作者 何杰 钟鸣 《才智》 2010年第31期51-52,共2页
1.引言GIBBS采样算法是一种较特殊的蒙特卡罗(Makov chain Monte Carlo,MCMC)法。该算法最早由Lawrence用于蛋白质序列中的模式识别。
关键词 采样算法 MOTIF 模式识别 蛋白质序列 贝叶斯模型 吉布斯 背景模型 调控元件 子序列 模体
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部