期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
中国荷斯坦牛TLR1基因SNPs快速筛查及蛋白功能预测 被引量:10
1
作者 吴恩芸 任稳稳 +3 位作者 李耀东 刘丽霞 曹忻 张丽 《核农学报》 CAS CSCD 北大核心 2019年第10期1940-1948,共9页
为探究中国荷斯坦牛Toll样受体1(TLR1)基因与中国荷斯坦牛乳房炎抗性的关联性,以中国荷斯坦牛为试验对象,构建DNA混合池,采用PCR扩增和直接测序法对中国荷斯坦牛TLR1基因进行单核苷酸多态性(SNP)检测,从而筛选出对中国荷斯坦牛免疫方面... 为探究中国荷斯坦牛Toll样受体1(TLR1)基因与中国荷斯坦牛乳房炎抗性的关联性,以中国荷斯坦牛为试验对象,构建DNA混合池,采用PCR扩增和直接测序法对中国荷斯坦牛TLR1基因进行单核苷酸多态性(SNP)检测,从而筛选出对中国荷斯坦牛免疫方面有显著影响的SNPs位点,同时应用在线软件对中国荷斯坦牛TLR1基因编码的蛋白质进行功能预测。结果表明,中国荷斯坦牛TLR1基因编码727个氨基酸,组成了一种不稳定的水溶性蛋白,蛋白质二、三级结构均以α-螺旋为主;PCR扩增后,在扩增片段处共发现8个SNPs位点,分别为A61T-TLR1、C632A-TLR1、C1408T-TLR1、C1451T-TLR1、A1461G-TLR1、A1475C-TLR1、G1550A-TLR1、G1596A-TLR1,其中A61T-TLR1、C632A-TLR1、C1408T-TLR1、A1461G-TLR1、G1596A-TLR1属错义突变,分别由原来的赖氨酸(Lys)、苯丙氨酸(Phe)、丙氨酸(Ala)、异亮氨酸(Ile)、缬氨酸(Val)突变为甲硫氨酸(Met)、亮氨酸(Leu)、缬氨酸(Val)、缬氨酸(Val)、异亮氨酸(Ile),SNPs位点的等位基因频率在突变前后均存在差异。DNA池结合直接测序技术检测到TLR1基因8个SNPs位点,可作为中国荷斯坦牛乳房炎的遗传标记进行深入研究;蛋白质功能预测结果表明,有多种与免疫相关的因子几率较高。本研究结果为中国荷斯坦牛在分子领域的抗病育种提供了理论依据。 展开更多
关键词 中国荷斯坦牛 TLR1基因 单核苷酸多态性 蛋白功能预测
下载PDF
基于不同文本表示的大规模蛋白功能预测探究
2
作者 乔羽 姚舒威 《微型电脑应用》 2018年第7期1-5,共5页
因为使用生化实验确定蛋白功能需要耗费大量的时间和资源,所以利用计算技术自动标注蛋白功能意义重大。基于文本进行蛋白质功能预测的方法可以充分利用蛋白序列以外的数据。为了探究文本分类中不同的文本表示对蛋白质功能预测任务的影响... 因为使用生化实验确定蛋白功能需要耗费大量的时间和资源,所以利用计算技术自动标注蛋白功能意义重大。基于文本进行蛋白质功能预测的方法可以充分利用蛋白序列以外的数据。为了探究文本分类中不同的文本表示对蛋白质功能预测任务的影响,通过实验分析了一系列主流的文本表示方法,包括传统的基于词袋模型的稀疏表示(TFIDF)和含有深度语义信息的稠密表示(W2V,GloVe,D2V),并做了两方面拓展:(1)对基于词向量的文本表示考虑使用IDF加权平均(WW2V,WGloVe);(2)稀疏表示与稠密表示的拼接结合(WW2V-TFIDF,WGloVe-TFIDF,D2V-TFIDF,Combined)。实验结果证明,IDF加权平均比直接平均效果更好;每个单独的表示侧重点不同,各有优缺点;稀疏表示与稠密表示具有互补性;多种表示的组合(结合了TFIDF,WW2V,WGloVe,D2V)效果最好。 展开更多
关键词 蛋白功能预测 机器学习 文本表示
下载PDF
基于生物信息学的蛋白质功能预测研究综述 被引量:1
3
作者 李昕晖 钱育蓉 +4 位作者 岳海涛 胡月 陈嘉颖 冷洪勇 马梦楠 《计算机工程与应用》 CSCD 北大核心 2023年第16期50-62,共13页
蛋白质功能预测任务旨在为缺失功能标签的蛋白质数据提供功能注释,随着蛋白质测序技术的发展,数据库中蛋白质数量迅速增长,由于蛋白质数据的复杂性和多元性,蛋白质功能预测任务极具挑战,受到研究人员的密切关注。梳理了机器学习在蛋白... 蛋白质功能预测任务旨在为缺失功能标签的蛋白质数据提供功能注释,随着蛋白质测序技术的发展,数据库中蛋白质数量迅速增长,由于蛋白质数据的复杂性和多元性,蛋白质功能预测任务极具挑战,受到研究人员的密切关注。梳理了机器学习在蛋白质功能预测中的发展历程;对近年来的蛋白质功能预测方法进行归类与总结,分析各类算法之间的异同;最后对蛋白质功能预测存在的问题进行讨论,并对该领域的未来研究进行展望。 展开更多
关键词 蛋白功能预测 蛋白质序列 机器学习 生物计算 生物信息学
下载PDF
利用序列和组合图卷积网络预测蛋白质功能 被引量:1
4
作者 秦琪琪 丁学明 王金雷 《小型微型计算机系统》 CSCD 北大核心 2023年第12期2692-2699,共8页
蛋白质功能的准确预测有利于推进生物医学发展,高通量测序技术的快速发展加快了蛋白质序列的提取速度,从而产生了大量未注释的蛋白质,并且新测序序列缺乏结构等生物信息,针对该问题提出了基于序列和组合图卷积网络的蛋白质功能预测模型(... 蛋白质功能的准确预测有利于推进生物医学发展,高通量测序技术的快速发展加快了蛋白质序列的提取速度,从而产生了大量未注释的蛋白质,并且新测序序列缺乏结构等生物信息,针对该问题提出了基于序列和组合图卷积网络的蛋白质功能预测模型(Protein Function Prediction using Sequences and Combined Graph Convolutional Networks, PFP-SCGCN).首先通过深度学习方法捕获蛋白质序列的多维特征信息,再通过多序列比对从蛋白质序列中提取进化耦合信息和氨基酸残基群落,然后利用进化耦合信息和氨基酸残基群落生成序列氨基酸之间两种不同连接程度的邻接矩阵,将这两种邻接矩阵与序列特征信息一起输入给组合图卷积网络进行信息融合,最后通过多个全连接层获得蛋白质功能类别信息.本文还通过分析PFP-SCGCN的特定网络层识别蛋白质功能位点,可帮助人们推测出新序列中的重要氨基酸.模型结果表明,PFP-SCGCN模型的功能预测准确率远高于对比方法,具有较好的鲁棒性,并且可以较准确的识别功能位点. 展开更多
关键词 蛋白功能预测 功能位点 图卷积网络 蛋白质序列
下载PDF
基于蛋白质网络功能模块的蛋白质功能预测 被引量:6
5
作者 卢宏超 石秋艳 +6 位作者 石宝晨 张治华 赵屹 唐素勤 熊磊 王强 陈润生 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2006年第5期446-451,共6页
在破译了基因序列的后基因组时代,随着系统生物学实验的快速发展,产生了大量的蛋白质相互作用数据,利用这些数据寻找功能模块及预测蛋白质功能在功能基因组研究中具有重要意义.打破了传统的基于蛋白质间相似度的聚类模式,直接从蛋白质... 在破译了基因序列的后基因组时代,随着系统生物学实验的快速发展,产生了大量的蛋白质相互作用数据,利用这些数据寻找功能模块及预测蛋白质功能在功能基因组研究中具有重要意义.打破了传统的基于蛋白质间相似度的聚类模式,直接从蛋白质功能团的角度出发,考虑功能团间的一阶和二阶相互作用,提出了模块化聚类方法(MCM),对实验数据进行聚类分析,来预测模块内未知蛋白质的功能.通过超几何分布P值法和增、删、改相互作用的方法对聚类结果进行预测能力分析和稳定性分析.结果表明,模块化聚类方法具有较高的预测准确度和覆盖率,有很好的容错性和稳定性.此外,模块化聚类分析得到了一些具有高预测准确度的未知蛋白质的预测结果,将会对生物实验有指导意义,其算法对其他具有相似结构的网络也具有普遍意义. 展开更多
关键词 蛋白质相互作用网络 蛋白功能预测 聚类
下载PDF
支持向量机程序SVMProt预测SARS病毒蛋白质的功能 被引量:4
6
作者 蔡从中 韩连漪 +1 位作者 王万录 陈宇综 《重庆大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第9期148-150,共3页
对SARS冠状病毒蛋白质功能的有效识别将有利于促进SARS传染病治疗药物的开发。应用基于支持向量机原理的SVMProt程序识别SARS冠状病毒蛋白质的功能,通过对SARS冠状病毒中2个已知功能的蛋白质功能的成功预测,说明SVMProt能够有效地应用于... 对SARS冠状病毒蛋白质功能的有效识别将有利于促进SARS传染病治疗药物的开发。应用基于支持向量机原理的SVMProt程序识别SARS冠状病毒蛋白质的功能,通过对SARS冠状病毒中2个已知功能的蛋白质功能的成功预测,说明SVMProt能够有效地应用于SARS冠状病毒蛋白质及其他种类蛋白质的功能预测。对SARS冠状病毒中至今仍未知其功能的蛋白质ORF13的功能进行了预测,结果显示ORF13是一种可能与DNA结合的核蛋白并兼有病毒体内结构蛋白的功能。 展开更多
关键词 非典 SARS冠状病毒蛋白 蛋白功能 蛋白功能预测 支持向量机
下载PDF
基于相互作用的蛋白质功能预测 被引量:2
7
作者 王正华 王秀鹤 +1 位作者 王勇献 张振慧 《激光生物学报》 CAS CSCD 2007年第4期390-393,共4页
蛋白质功能预测是后基因时代研究的热点问题。基于相互作用的蛋白质功能预测方法目前应用比较广泛,但是当"伙伴蛋白质"(interacting partners)数目k较小时,其预测准确率不高。从蛋白质相互作用网络入手,结合"小世界网络&... 蛋白质功能预测是后基因时代研究的热点问题。基于相互作用的蛋白质功能预测方法目前应用比较广泛,但是当"伙伴蛋白质"(interacting partners)数目k较小时,其预测准确率不高。从蛋白质相互作用网络入手,结合"小世界网络"特性,有效解决了k较小时预测准确率不高的问题。对酵母(Saccharomyces cerevisiae)蛋白质的相互作用网络进行预测,当k≤4时其预测准确率比相同条件下的GO(global optimization)方法有一定提高。实验结果表明:该方法能够有效的应用于伙伴蛋白质数目较小时的蛋白质功能预测。 展开更多
关键词 蛋白功能预测 蛋白质相互作用 小世界网络
下载PDF
基于贝叶斯网络和相互作用可信度的蛋白质功能预测方法 被引量:2
8
作者 倪青山 王正志 +1 位作者 王广云 张纪阳 《激光生物学报》 CAS CSCD 2009年第3期395-400,共6页
蛋白质功能注释是后基因组时代研究的核心内容之一,基于蛋白质相互作用网络的蛋白质功能预测方法越来越受到研究者们的关注。提出了一种基于贝叶斯网络和蛋白质相互作用可信度的蛋白质功能预测方法。该方法在功能预测过程中为待注释的... 蛋白质功能注释是后基因组时代研究的核心内容之一,基于蛋白质相互作用网络的蛋白质功能预测方法越来越受到研究者们的关注。提出了一种基于贝叶斯网络和蛋白质相互作用可信度的蛋白质功能预测方法。该方法在功能预测过程中为待注释的蛋白质建立贝叶斯网络预测模型,并充分考虑了蛋白质相互作用的可信度问题。在构建的芽殖酵母数据集上的三重交叉验证测试表明,在功能预测过程中考虑蛋白质可信度能够有效地提高功能预测的性能。与现有一些算法相比,该方法能够给出令人满意的预测效果。 展开更多
关键词 蛋白功能预测 蛋白质相互作用 相互作用可信度 贝叶斯网络
下载PDF
基于多网络数据协同矩阵分解预测蛋白质功能 被引量:1
9
作者 余国先 王可尧 +2 位作者 傅广垣 王峻 曾安 《计算机研究与发展》 EI CSCD 北大核心 2017年第12期2931-2944,共14页
准确预测蛋白质功能是生物信息学的核心任务之一,也是人工智能在生物数据分析中的重要应用点之一.高通量技术的广泛应用产生了大量的生物分子功能关联网络,整合这些网络可更为全面地分析理解蛋白质功能机理,提升蛋白质功能预测精度.已... 准确预测蛋白质功能是生物信息学的核心任务之一,也是人工智能在生物数据分析中的重要应用点之一.高通量技术的广泛应用产生了大量的生物分子功能关联网络,整合这些网络可更为全面地分析理解蛋白质功能机理,提升蛋白质功能预测精度.已有多种基于数据整合的蛋白质功能预测方法,但它们通常难以应用到较大功能标签空间,未利用标签间关联性和差异性整合多个网络.提出一种基于多网络数据协同矩阵分解的蛋白质功能预测方法(ProCMF).该方法首先利用非负矩阵分解将蛋白质-功能标签关联矩阵分解为2个低秩矩阵,挖掘蛋白质与标签之间的潜在关联.其次,为利用标签间关联关系和多种蛋白质特征数据,ProCMF分别基于上述2个低秩矩阵定义平滑正则性,约束指导低秩矩阵的协同分解.为了差异性地集成多个网络,ProCMF对不同的网络设置不同的权重.最后ProCMF将上述目标统一到一个目标方程中,并用一种交替迭代的方法分别优化求解低秩矩阵和网络权重.在酵母菌、人类和老鼠3个模式物种的多网络数据集上的实验结果表明:ProCMF获得了较其他相关算法更好的预测性能,ProCMF能有效地处理大量的功能标签和区分性地整合多个网络. 展开更多
关键词 蛋白功能预测 功能关联网络 网络集成 非负矩阵分解 协同分解
下载PDF
改进LPU用于蛋白质功能预测 被引量:1
10
作者 陈义明 李舟军 刘军万 《计算机工程与科学》 CSCD 北大核心 2011年第12期148-152,共5页
本文将蛋白质功能预测定义为典型的LPU问题。针对有很少正例的LPU算法存在的不平衡或过拟合问题,提出了基于最近邻和凸组合理论的创建人工正例扩充正例集合的方法,同时使用一类支持向量机获取初始最可能的负例,通过迭代两类支持向量机... 本文将蛋白质功能预测定义为典型的LPU问题。针对有很少正例的LPU算法存在的不平衡或过拟合问题,提出了基于最近邻和凸组合理论的创建人工正例扩充正例集合的方法,同时使用一类支持向量机获取初始最可能的负例,通过迭代两类支持向量机将分类超平面移到一个合适的位置,由交叉验证获得代表性的负例,从而改进了典型LPU算法学习最优分类器的过程。针对酵母基因组数据的实验表明:我们的算法在很少正例的功能类上的预测性能有显著提高,在其他类上的性能也有一定的改善。 展开更多
关键词 蛋白功能预测 支持向量机 LPU
下载PDF
基于K近邻的蛋白质功能的预测方法 被引量:2
11
作者 倪青山 王正志 +1 位作者 黎刚果 孟祥林 《生物医学工程研究》 2009年第2期87-90,共4页
蛋白质功能预测是后基因组时代研究的重要问题之一。利用蛋白质相互作用网络,提出了一种基于K近邻的蛋白质功能的注释方法,该方法首先计算待注释的蛋白质与所有已知功能的蛋白质间的注释环境相似度,选择其中最相似的K个蛋白质,将该K个... 蛋白质功能预测是后基因组时代研究的重要问题之一。利用蛋白质相互作用网络,提出了一种基于K近邻的蛋白质功能的注释方法,该方法首先计算待注释的蛋白质与所有已知功能的蛋白质间的注释环境相似度,选择其中最相似的K个蛋白质,将该K个蛋白质的功能注释进行加权平均,作为待注释的蛋白质最终的功能注释。在构建的芽殖酵母的两组大规模相互作用数据集上的测试表明,该方法能够有效的对蛋白质功能进行预测,在蛋白质功能预测性能上优于现有的一些方法。 展开更多
关键词 蛋白质相互作用 蛋白功能预测 K近邻算法 相似性 加权方法
下载PDF
基于双重索引矩阵的蛋白质功能预测 被引量:1
12
作者 孟军 张信 《计算机应用》 CSCD 北大核心 2015年第6期1637-1642,共6页
针对单一数据源预测蛋白质功能效果不佳以及蛋白质相互作用网络信息不完全等问题,提出一种多数据源融合和基于双重索引矩阵的随机游走的蛋白质功能预测(MSI-RWDIM)算法。该算法使用了蛋白质序列、基因表达和蛋白质相互作用数据预测蛋白... 针对单一数据源预测蛋白质功能效果不佳以及蛋白质相互作用网络信息不完全等问题,提出一种多数据源融合和基于双重索引矩阵的随机游走的蛋白质功能预测(MSI-RWDIM)算法。该算法使用了蛋白质序列、基因表达和蛋白质相互作用数据预测蛋白质功能,并根据这些数据源特性构建相应的相互作用加权网络;然后融合各数据源加权网络并结合功能相关性网络构建双重索引矩阵,使用随机游走算法计算得分进而预测蛋白质功能。在酵母数据集的五折交叉验证中,MSI-RWDIM算法具有较高的准确率和较低的覆盖率,还可降低功能标签损失率。研究结果表明,MSI-RWDIM算法的总体性能优于常用的k-近邻、直推式多标签集成分类和快速同步加权方法。 展开更多
关键词 多数据源融合 随机游走 双重索引矩阵 功能相关性网络 蛋白功能预测
下载PDF
基于随机游走的蛋白质功能预测算法设计与实现 被引量:2
13
作者 马吉权 贾翠翠 张军杰 《黑龙江大学工程学报》 2015年第3期73-78,共6页
在构建蛋白质相互作用网络时从通路数据出发,利用通路数据整合蛋白质相互作用网络。提出了一个基于随机游走的蛋白质功能预测方法,在该算法中把已知功能的蛋白质当作起始点,对于随机游走在蛋白质互作网络中产生的邻居信息,转换为注释模... 在构建蛋白质相互作用网络时从通路数据出发,利用通路数据整合蛋白质相互作用网络。提出了一个基于随机游走的蛋白质功能预测方法,在该算法中把已知功能的蛋白质当作起始点,对于随机游走在蛋白质互作网络中产生的邻居信息,转换为注释模式信息,并根据已知功能的蛋白质的功能来提取未知功能蛋白质的注释模式。利用传统的K近邻算法从训练样本集中找到未知功能蛋白质的k个最近邻。最后,结合多标签分类的K近邻算法,统计k个近邻中蛋白质的功能类数目,基于最大后验概率预测未知功能蛋白质属于的功能标签类。通过在构建蛋白质互作网络进行实验,结果表明提出的方案能够有效地进行蛋白质功能预测。 展开更多
关键词 蛋白功能预测 蛋白质-蛋白质相互作用网络 随机游走 蛋白功能注释 K近邻 多标签分类
下载PDF
面向蛋白质功能预测中有向无环图标记结构的多示例多标记学习 被引量:1
14
作者 吴建盛 唐诗迪 +2 位作者 梅德进 朱燕翔 刁业敏 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第3期23-30,共8页
在多示例多标记学习问题中,标记之间往往是相互关联的,其中有向无环图结构是一种常见的层次关联结构,可见于蛋白质的基因本体学生物学功能预测的应用场景中。针对其标记间的有向无环图结构,提出了一种新的多示例多标记学习算法。算法从... 在多示例多标记学习问题中,标记之间往往是相互关联的,其中有向无环图结构是一种常见的层次关联结构,可见于蛋白质的基因本体学生物学功能预测的应用场景中。针对其标记间的有向无环图结构,提出了一种新的多示例多标记学习算法。算法从原始数据的特征空间训练出所有标记共享的低维子空间,通过随机梯度下降方法来降低模型排序损失,并融入标记间有向无环图结构关系对预测标记进行优化。将该算法应用于多个数据集的蛋白质功能预测中,实验结果表明,该算法具有更高的效率及预测性能。 展开更多
关键词 多示例多标记学习 蛋白功能预测 有向无环图标记结构 标记相关性
下载PDF
结合蛋白质互作与功能类的可分性预测蛋白质功能
15
作者 朱明珠 高磊 +5 位作者 李彦辉 马文才 朱晶 张敏 郭政 李霞 《中国生物医学工程学报》 CAS CSCD 北大核心 2009年第2期270-274,共5页
当前蛋白质功能注释体系的欠完备性限制了生物学及医药研究的进一步发展和应用,有必要将基因本体功能知识体系(GO)的功能注释信息进一步深化,把蛋白质注释到GO中更具体的功能节点。为此,提出一种结合互作信息的新的预测策略,将酵母蛋白... 当前蛋白质功能注释体系的欠完备性限制了生物学及医药研究的进一步发展和应用,有必要将基因本体功能知识体系(GO)的功能注释信息进一步深化,把蛋白质注释到GO中更具体的功能节点。为此,提出一种结合互作信息的新的预测策略,将酵母蛋白质准确地预测到更具体的功能类中。针对GO中的每个候选预测空间来构建分类器,并选用功能类分离性指标对候选预测空间进行评价,选出该指标大于一定阈值的候选预测空间,再将父节点中的蛋白质预测到子节点中。通过扩展深化预测的范围,可将预测空间一直上溯到根节点,对蛋白质功能进行深层预测,得到很好的预测结果。以上溯两层的预测空间为例,平均真阳性率和覆盖率分别达到94.02%和95.82%。 展开更多
关键词 蛋白功能深化预测 基因本体功能知识体系(GO) 预测空间
下载PDF
MIMLRBF预测谷物蛋白质功能方法的改进
16
作者 刘静 崔双龙 +1 位作者 曹洪伟 管骁 《食品与生物技术学报》 CAS CSCD 北大核心 2021年第4期36-43,共8页
随着人们对营养与保健功能的关注,谷物蛋白质功能预测已经成为当前研究热点。面对大量已完成测序的谷物蛋白质基因组数据,利用计算方法来预测谷物蛋白质功能已经成为主流。从谷物蛋白质结构域序列出发,首次将MIMLRBF算法运用到蛋白质功... 随着人们对营养与保健功能的关注,谷物蛋白质功能预测已经成为当前研究热点。面对大量已完成测序的谷物蛋白质基因组数据,利用计算方法来预测谷物蛋白质功能已经成为主流。从谷物蛋白质结构域序列出发,首次将MIMLRBF算法运用到蛋白质功能预测,并在此算法基础上,提出了多种改进后的谷物蛋白质功能预测模型。其中,针对平均Hausdorff距离削弱了两种蛋白质之间最短结构域距离所起作用的问题,为平均Hausdorff距离引入一个自动调节系数来计算蛋白质之间的相似性。同时,为提高MIMLRBF算法的预测效果,利用改进后的混合径向基核函数进行激活,得到了改进后的MIMLRBF算法模型。最终利用主流的评价标准对预测结果进行评价,可以发现改进后的MIMLRBF比传统的预测效果更好,证明了所建模型的优越性。 展开更多
关键词 谷物 蛋白功能预测 多示例多标记 HAUSDORFF距离 核函数
下载PDF
基于有向双关系图和多核融合的蛋白质功能预测
17
作者 孟军 刁印 《计算机应用》 CSCD 北大核心 2014年第12期3433-3437,3474,共6页
针对多源异构蛋白质相互作用网络信息量大、数据冗余导致预测结果不能充分反映数据分布信息的问题,将功能类别网络和蛋白质相互作用网络相结合,提出基于有向双关系图和多核融合的多标记学习算法。首先,构建基于含有损失函数的目标方程... 针对多源异构蛋白质相互作用网络信息量大、数据冗余导致预测结果不能充分反映数据分布信息的问题,将功能类别网络和蛋白质相互作用网络相结合,提出基于有向双关系图和多核融合的多标记学习算法。首先,构建基于含有损失函数的目标方程和最大期望算法的自适应模型;然后,利用图优化策略融合功能类别和蛋白质相互作用网络构成的多个关联矩阵;最后,将融合后的关联矩阵代入模型中预测蛋白质功能。在Yeast和Mouse的蛋白质多源异构数据上的实验结果表明,提出的方法具有预测准确率高、标签损失率低等优势。 展开更多
关键词 有向双关系图 多核融合 半监督学习 多标记 蛋白功能预测
下载PDF
基于正负样例的蛋白质功能预测 被引量:6
18
作者 傅广垣 余国先 +1 位作者 王峻 郭茂祖 《计算机研究与发展》 EI CSCD 北大核心 2016年第8期1753-1765,共13页
蛋白质功能预测是后基因组时代生物信息学的核心问题之一.蛋白质功能标记数据库通常仅提供蛋白质具有某个功能(正样例)的信息,极少提供蛋白质不具有某个功能(负样例)的信息.当前的蛋白质功能预测方法通常仅利用蛋白质正样例,极少关注量... 蛋白质功能预测是后基因组时代生物信息学的核心问题之一.蛋白质功能标记数据库通常仅提供蛋白质具有某个功能(正样例)的信息,极少提供蛋白质不具有某个功能(负样例)的信息.当前的蛋白质功能预测方法通常仅利用蛋白质正样例,极少关注量少但富含信息的蛋白质负样例.为此,提出一种基于正负样例的蛋白质功能预测方法(protein function prediction using positive and negative examples,ProPN).ProPN首先通过构造一个有向符号混合图描述已知的蛋白质与功能标记的正负关联信息、蛋白质之间的互作信息和功能标记间的关联关系,再通过符号混合图上的标签传播算法预测蛋白质功能.在酵母菌、老鼠和人类蛋白质数据集上的实验表明,ProPN不仅在预测已知部分功能标记蛋白质的负样例任务上优于现有算法,在预测功能标记完全未知蛋白质的功能任务上也获得了较其他相关方法更高的精度. 展开更多
关键词 蛋白功能预测 正样例 负样例 符号混合图 标签传播
下载PDF
基于氨基酸序列预测蛋白质功能性点突变位点 被引量:2
19
作者 宋卓 张宁 +2 位作者 阮吉寿 杨卓 张涛 《生物物理学报》 CAS CSCD 北大核心 2007年第2期134-138,共5页
突变是研究蛋白质结构和功能的重要方法。点突变实验中,突变位点的选择随机性大,若能对突变后蛋白质功能是否发生变化做出预测,将大大减少实验的盲目性。为此,作者设计了一个基于信号处理的单点替换突变预测模型,对序列上每个位点所有... 突变是研究蛋白质结构和功能的重要方法。点突变实验中,突变位点的选择随机性大,若能对突变后蛋白质功能是否发生变化做出预测,将大大减少实验的盲目性。为此,作者设计了一个基于信号处理的单点替换突变预测模型,对序列上每个位点所有可能的氨基酸替换的效果进行估计。使用蛋白质突变数据库(Protein Mutant Database,PMD)里的11个蛋白共2600多个点突变的数据集,对以上模型进行了验证。结果表明正确率高达81.2%,并且推荐出的替换选择位点仅占所有可能替换突变的3.1%。在体外定点突变实验中,使用本模型推荐的高可能性功能突变位点将有助于提高实验的成功率。该模型使用蛋白质的氨基酸序列信息,特别是对未知结构的蛋白质同样适用。然而,由于缺乏足够的突变实验数据,本模型的应用仍需进一步完善和验证。 展开更多
关键词 点突变 替换突变 蛋白功能预测 信号处理
下载PDF
基于模糊积分多源数据融合的蛋白质功能预测 被引量:2
20
作者 赵研 卢奕南 权勇 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第1期63-69,共7页
近年来多源数据融合成为蛋白质功能预测的一个热点,本文提出一种基于Choquet模糊积分的多源数据融合方法对酵母蛋白进行预测.文中采用支持向量机做基础分类器对各个数据源进行预测,输出概率形式的结果.使用粒子群算法确定模糊密度,基于C... 近年来多源数据融合成为蛋白质功能预测的一个热点,本文提出一种基于Choquet模糊积分的多源数据融合方法对酵母蛋白进行预测.文中采用支持向量机做基础分类器对各个数据源进行预测,输出概率形式的结果.使用粒子群算法确定模糊密度,基于Choquet模糊积分对每个数据源的结果进行融合.实验表明Choquet模糊积分蛋白质功能预测结果要明显优于传统的加权平均法、支持向量机方法和K近邻方法. 展开更多
关键词 CHOQUET模糊积分 数据融合 蛋白功能预测
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部