期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
词袋模型在蛋白质亚细胞定位预测中的应用 被引量:5
1
作者 赵南 张梁 +2 位作者 薛卫 王雄飞 任守纲 《食品与生物技术学报》 CAS CSCD 北大核心 2017年第3期296-301,共6页
运用词袋模型结合传统的蛋白质特征提取算法提取蛋白质序列特征,采用K-means算法构建字典,计算获得蛋白质序列的词袋特征,最终将提取的特征值送入SVM多类分类器,对数据集中蛋白质的亚细胞位置进行预测,在一定程度上提高了亚细胞定位预... 运用词袋模型结合传统的蛋白质特征提取算法提取蛋白质序列特征,采用K-means算法构建字典,计算获得蛋白质序列的词袋特征,最终将提取的特征值送入SVM多类分类器,对数据集中蛋白质的亚细胞位置进行预测,在一定程度上提高了亚细胞定位预测的准确率。 展开更多
关键词 词袋模型 K-MEANS 支持向量机 亚细胞定位预测
下载PDF
蛋白质亚细胞定位预测研究综述 被引量:5
2
作者 乔善平 闫宝强 《计算机应用研究》 CSCD 北大核心 2014年第2期321-327,共7页
蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越... 蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越重要。为了能够把握该问题的研究状况,从数据集构建、蛋白质特征提取与表示、预测算法设计、算法测试和Web服务的建立等五个方面对蛋白质亚细胞定位预测的研究进行了综述。指出了目前该研究领域需要解决的核心问题及难点问题,分析了当前研究中出现的一些新情况,并对将来的研究方向和研究重点进行了展望。 展开更多
关键词 蛋白质亚细胞定位预测 特征表示 算法设计 算法测试 WEB服务器
下载PDF
基于GM(2,1)的亚细胞定位预测 被引量:4
3
作者 林卫中 肖绚 《计算机工程》 CAS CSCD 北大核心 2009年第8期225-226,229,共3页
对于蛋白质氨基酸序列,使用GM(2,1)模型的参数作为伪氨基酸成分,加上各氨基酸在序列中所占比例,构成蛋白质的灰色伪氨基酸成分表示。利用扩大协方差算法预测亚细胞定位,开发基于该方法的亚细胞定位预测服务器。在相同的数据集上,对比实... 对于蛋白质氨基酸序列,使用GM(2,1)模型的参数作为伪氨基酸成分,加上各氨基酸在序列中所占比例,构成蛋白质的灰色伪氨基酸成分表示。利用扩大协方差算法预测亚细胞定位,开发基于该方法的亚细胞定位预测服务器。在相同的数据集上,对比实验结果显示,该预测服务器在总体预测率上达到77.6%,比其他预测方法优越。相关的研究拓展了灰色理论在生物信息学上的应用。 展开更多
关键词 细胞定位 灰色模型GM(2 1) 灰色伪氨基酸成分 亚细胞定位预测服务器
下载PDF
基于三层集成多标记学习的蛋白质多亚细胞定位预测 被引量:1
4
作者 乔善平 闫宝强 《计算机应用》 CSCD 北大核心 2016年第8期2150-2156,共7页
针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框... 针对多标记学习和集成学习在解决蛋白质多亚细胞定位预测问题上应用还不成熟的状况,研究基于集成多标记学习的蛋白质多亚细胞定位预测方法。首先,从多标记学习和集成学习相结合的角度提出了一种三层的集成多标记学习系统框架结构,该框架将学习算法和分类器进行了层次性分类,并把二分类学习、多分类学习、多标记学习和集成学习进行有效整合,形成一个通用型的三层集成多标记学习模型;其次,基于面向对象技术和统一建模语言(UML)对系统模型进行了设计,使系统具备良好的可扩展性,通过扩展手段增强系统的功能和提高系统的性能;最后,使用Java编程技术对模型进行扩展,实现了一个学习系统软件,并成功应用于蛋白质多亚细胞定位预测问题上。通过在革兰氏阳性细菌数据集上进行测试,验证了系统功能的可操作性和较好的预测性能,该系统可以作为解决蛋白质多亚细胞定位预测问题的一个有效工具。 展开更多
关键词 蛋白质多亚细胞定位预测 多标记学习 集成学习 面向对象技术 JAVA
下载PDF
蛋白质亚细胞定位预测中的序列编码技术研究 被引量:1
5
作者 马军伟 高新中 张杰 《计算机科学》 CSCD 北大核心 2012年第S3期283-287,312,共6页
随着后基因组时代的来临,蛋白质序列数量增长迅速,利用实验手段分析蛋白质亚细胞定位不易大规模进行。近年来,通过提取蛋白质的各种特征信息(序列编码技术),自动预测蛋白质的亚细胞定位的算法得到了较快的发展。综述了当前已有的序列编... 随着后基因组时代的来临,蛋白质序列数量增长迅速,利用实验手段分析蛋白质亚细胞定位不易大规模进行。近年来,通过提取蛋白质的各种特征信息(序列编码技术),自动预测蛋白质的亚细胞定位的算法得到了较快的发展。综述了当前已有的序列编码技术成果,并指出了存在的问题及可能的发展方向。 展开更多
关键词 蛋白质亚细胞定位预测 序列编码技术 氨基酸组成成分 功能域组成 基因本体
下载PDF
家蚕蛋白亚细胞定位预测模型的构建及其初步应用
6
作者 王小飞 石卓兴 +5 位作者 谭淑敏 李杰 张耀洲 于威 陈剑清 舒特俊 《浙江理工大学学报(自然科学版)》 2015年第2期238-243,共6页
为研究家蚕蛋白及家蚕杆状病毒蛋白的亚细胞定位并提高预测模型的特异性和准确率,构建了家蚕蛋白亚细胞定位预测模型,并将该模型初步应用于家蚕核型多角体病毒(BmNPV)P10蛋白的亚细胞定位预测中。结果表明,总体预测准确率在不分段时为60... 为研究家蚕蛋白及家蚕杆状病毒蛋白的亚细胞定位并提高预测模型的特异性和准确率,构建了家蚕蛋白亚细胞定位预测模型,并将该模型初步应用于家蚕核型多角体病毒(BmNPV)P10蛋白的亚细胞定位预测中。结果表明,总体预测准确率在不分段时为60.6%,分两段、三段和四段时分别为78.9%、78.4%和80.6%;对BmNPV P10蛋白的预测结果为宿主细胞核,通过免疫细胞荧光实验对预测结果进行验证,结果表明预测结果与实际相符。因此,采用分段的方法能够提高预测准确率,且家蚕病毒蛋白可以利用其宿主家蚕蛋白亚细胞定位预测模型进行亚细胞定位。 展开更多
关键词 家蚕 亚细胞定位预测 支持向量机 P10蛋白
下载PDF
PSO_BFA优化词袋模型及蛋白质亚细胞定位预测 被引量:2
7
作者 胡雪娇 陈行健 +1 位作者 赵南 薛卫 《计算机工程与应用》 CSCD 北大核心 2020年第1期165-171,共7页
提出了一种基于PSO_BFA优化的词袋模型。传统词袋模型有两个重要参数:窗口大小d和字典大小k。结合粒子群算法和细菌觅食算法产生新的PSO_BFA混合优化算法,在PSO进行局部搜索时,加入BFA的复制和迁移行为,得到PSO_BFA的最优解即为窗口大... 提出了一种基于PSO_BFA优化的词袋模型。传统词袋模型有两个重要参数:窗口大小d和字典大小k。结合粒子群算法和细菌觅食算法产生新的PSO_BFA混合优化算法,在PSO进行局部搜索时,加入BFA的复制和迁移行为,得到PSO_BFA的最优解即为窗口大小和字典大小的最佳组合。将优化词袋模型与蛋白质序列的氨基酸组成算法和伪氨基酸组成算法结合,获得蛋白质序列的词袋特征。实验结果证明,基于PSO_BFA优化的词袋模型能有效提高蛋白质亚细胞定位预测的精度。 展开更多
关键词 词袋模型 粒子群算法 细菌觅食 亚细胞定位预测
下载PDF
基于特征融合与平衡数据集的蛋白质亚细胞定位预测研究
8
作者 余静 张靖 《信息技术与信息化》 2021年第3期137-139,142,共4页
确定蛋白质的亚细胞位置对于了解蛋白质的功能以及药物设计具有重要作用。在后基因时代,测序序列呈现爆发式增长,而传统实验手段无法满足海量蛋白质的亚细胞定位需求。将蛋白质亚细胞定位问题引入到机器学习领域可有效解决该难题。本文... 确定蛋白质的亚细胞位置对于了解蛋白质的功能以及药物设计具有重要作用。在后基因时代,测序序列呈现爆发式增长,而传统实验手段无法满足海量蛋白质的亚细胞定位需求。将蛋白质亚细胞定位问题引入到机器学习领域可有效解决该难题。本文提出基于PSSM-MLSMOTE方法的革兰氏阴性菌蛋白质亚细胞定位预测。首先使用AAO和PSSM-AAO方法对蛋白质序列进行特征提取,并将两种算法融合。然后采用MLSMOTE方法平衡数据集,最后将处理后的数据集输入MLkNN算法分类器中预测蛋白质的亚细胞位置。通过jackknife检验,总体召回率可达到83.4%,此模型能够有效预测蛋白质的亚细胞位置。 展开更多
关键词 亚细胞定位预测 蛋白质序列 革兰氏阴性菌 特征融合 MLSMOTE方法
下载PDF
基于集成分类器的凋谢蛋白亚细胞定位预测方法
9
作者 李爱明 魏蓉 《计算机与应用化学》 CAS CSCD 北大核心 2010年第5期645-648,共4页
凋谢蛋白亚细胞定位预测是研究凋谢蛋白生物功能的1种重要的方法,也是生物信息学研究的重要领域之一。提高凋谢蛋白亚细胞定位预测模型准确性和实用性是该研究的重点。在本研究中,提出了以模糊K近邻分类算法作为基础分类器的集成分类算... 凋谢蛋白亚细胞定位预测是研究凋谢蛋白生物功能的1种重要的方法,也是生物信息学研究的重要领域之一。提高凋谢蛋白亚细胞定位预测模型准确性和实用性是该研究的重点。在本研究中,提出了以模糊K近邻分类算法作为基础分类器的集成分类算法。以蛋白质序列内不同间隔的二肽组成表示基本的蛋白质序列的特征集合,采用二进制粒子群算法作为特征选择方法提取能够有效的蛋白质序列特征。这些经过特征选择后的蛋白质序列特征作为集成分类算法中每一个基础分类器的输入向量。经过在2个常用的数据集上使用Jackknife测试,本文算法在CL317数据集上取得了91.5%的预测准确率,在ZW225数据集上取得了88.0%的准确率。与前人报道的算法预测结果比较,本文方法取得了较好的准确率。与使用相同数据集的已经报道凋谢蛋白亚细胞定位预测算法相比,本研究方法取得了预测准确率。 展开更多
关键词 凋谢蛋白 亚细胞定位预测 二进制粒子群算法 特征选择
原文传递
葡萄基因组无内含子基因生物信息学及其表达分析 被引量:3
10
作者 李傲 崔梦杰 +4 位作者 刘众杰 陈立德 贾海峰 上官凌飞 房经贵 《南京农业大学学报》 CAS CSCD 北大核心 2018年第4期655-661,共7页
[目的]本文旨在研究葡萄(Vitis vinifera)无内含子基因的结构特征、功能以及表达特点。[方法]对葡萄19条染色体上4 906个(占整个基因组的13.8%)无内含子基因情况进行分析,并研究了无内含子基因的亚细胞结构、GO功能类型以及基因在不同... [目的]本文旨在研究葡萄(Vitis vinifera)无内含子基因的结构特征、功能以及表达特点。[方法]对葡萄19条染色体上4 906个(占整个基因组的13.8%)无内含子基因情况进行分析,并研究了无内含子基因的亚细胞结构、GO功能类型以及基因在不同组织的表达情况。[结果]葡萄无内含子基因数与每条染色体长度和染色体的基因总数存在正相关关系,每条染色体上无内含子基因占染色体上基因总数的1.2%~1.5%,同时无内含子基因在同一条染色体上的分布是不均匀的,更偏向富集于染色体的两端。葡萄无内含子基因的平均长度为997 bp,比总基因的平均长度短,是总基因长度的1/5。葡萄无内含子基因的亚细胞定位表明,基因产物分布在叶绿体上的数最多,线粒体上几乎没有。基因功能预测结果表明,葡萄无内含子基因主要为生长因子、转录调控、电压门控离子通道以及结构蛋白4种,其中更多参与生长调节。葡萄无内含子基因在不同组织中的表达水平低于有内含子的基因。[结论]葡萄无内含子基因与有内含子基因相比长度较短,表达水平较低。 展开更多
关键词 葡萄 无内含子基因 生物信息学 亚细胞定位预测 功能预测 基因表达
下载PDF
胃蛋白酶Pepsin A性质与结构分析 被引量:2
11
作者 董铭洋 《当代化工研究》 2018年第10期177-179,共3页
胃蛋白酶是一种肽链内切酶,它将蛋白质分解成较小的肽(即蛋白酶)。在胃中产生,是人类和许多其他动物消化系统中的主要消化酶之一,在那里它有助于消化食物中的蛋白质。由胃壁中的主要细胞释放的胃蛋白酶原,与胃液的盐酸混合后,胃蛋白酶... 胃蛋白酶是一种肽链内切酶,它将蛋白质分解成较小的肽(即蛋白酶)。在胃中产生,是人类和许多其他动物消化系统中的主要消化酶之一,在那里它有助于消化食物中的蛋白质。由胃壁中的主要细胞释放的胃蛋白酶原,与胃液的盐酸混合后,胃蛋白酶原激活成为胃蛋白酶。本文对胃蛋白酶的基本特性进行了初步分析,通过分析胃蛋白酶氨基酸组成、疏水性表明胃蛋白酶具有酸性蛋白、胶原蛋白、黏蛋白等特征,整体呈现疏水性。利用MEGA软件进行胃蛋白酶系统发育分析,结果表明人与日本猕猴亲缘关系高度相近,而牛和日本猕猴两者的亲缘关系较远。使用PSORTII分析工具对胃蛋白酶亚细胞定位进行预测,结果表明胃蛋白酶主要分布于细胞外。最后,采用同源建模法构建了胃蛋白酶的三级结构,并对建模质量进行了评估,结果表明三级结构预测总体准确。 展开更多
关键词 PepsinA 系统发育分析 亚细胞定位预测 三级结构预测
下载PDF
乳腺癌致病基因BRCA1的生物信息学分析 被引量:1
12
作者 辛艾玲 《当代化工研究》 2019年第1期186-188,共3页
BRCA1作为乳腺癌关键蛋白参与了乳腺癌和卵巢癌的发生,本文对BRCA1基本特性进行了初步的分析,通过分析其整体的亲疏水性,氨基酸组成,表明BRCA1倾向是核蛋白,整体呈亲水性。使用PSORT2分析工具对BRCA1亚细胞定位进行预测,表明BRCA1蛋白... BRCA1作为乳腺癌关键蛋白参与了乳腺癌和卵巢癌的发生,本文对BRCA1基本特性进行了初步的分析,通过分析其整体的亲疏水性,氨基酸组成,表明BRCA1倾向是核蛋白,整体呈亲水性。使用PSORT2分析工具对BRCA1亚细胞定位进行预测,表明BRCA1蛋白主要分布在细胞核中。利用MEGA软件进行BRCA1系统发育分析,结果表明人BRCA1与猿的BRCA1亲缘关系高度相近。最后,采用同源建模(比较建模)方法构建了BRCA1蛋白的三级结构,从建模质量评估显示预测结果准确。 展开更多
关键词 BRCA1蛋白 三级结构预测 亚细胞定位预测 系统发育分析
下载PDF
EGFR蛋白的生物信息学初步分析
13
作者 刘一凡 《科技风》 2019年第2期59-61,共3页
EGFR(Epidermal Growth Factor Receptor)是表皮生长因子受体(HER)中的一种重要蛋白,属于EGF(Epidermal Growth Factor)家族。作为一种跨膜蛋白,其信号通路对细胞多种生理过程起重要作用。本文中从该蛋白的氨基酸组成、亲水性分析、系... EGFR(Epidermal Growth Factor Receptor)是表皮生长因子受体(HER)中的一种重要蛋白,属于EGF(Epidermal Growth Factor)家族。作为一种跨膜蛋白,其信号通路对细胞多种生理过程起重要作用。本文中从该蛋白的氨基酸组成、亲水性分析、系统发育分析,亚细胞定位,三级结构模拟等多个方面对该蛋白进行了生物信息学分析,这些结果有助于我们更进一步地了解EGFR蛋白的结构与功能。 展开更多
关键词 EGFR 生物信息学 初步分析 EGFR蛋白 系统发育分析 亚细胞定位预测 三级结构预测
下载PDF
Kras基因性质与结构分析
14
作者 陈薄羲 《当代化工研究》 2019年第2期184-186,共3页
Kras蛋白作为肿瘤"开关",参与了大多数肿瘤的突变。本文对Kras基本特性进行了初步地分析,通过分析Kras氨基酸组成、疏水性表明Kras蛋白具有酸性蛋白质、胶原蛋白、核蛋白、能量蛋白、一些RNA结合模体等特征,整体呈现亲水性。... Kras蛋白作为肿瘤"开关",参与了大多数肿瘤的突变。本文对Kras基本特性进行了初步地分析,通过分析Kras氨基酸组成、疏水性表明Kras蛋白具有酸性蛋白质、胶原蛋白、核蛋白、能量蛋白、一些RNA结合模体等特征,整体呈现亲水性。利用MEGA软件进行Kras系统发育分析,结果表明人Kras与大鼠、小鼠的Kras亲缘关系高度相近。使用PSORTII分析工具对Kras亚细胞定位进行预测,表明Kras蛋白主要分布在细胞质中。 展开更多
关键词 KRAS 氨基酸组成分析 系统发育分析 亚细胞定位预测 三级结构预测
下载PDF
p53蛋白性质与结构分析
15
作者 刘严木 《当代化工研究》 2017年第7期112-114,共3页
p53作为关键肿瘤抑制蛋白参与了50%以上肿瘤的发生,本文对p53基本特性进行了初步地分析,通过分析p53氨基酸组成、疏水性表明p53蛋白具有酸性蛋白质、胶原蛋白、核蛋白、一些RNA结合模体等特征,整体呈现亲水性。利用MEGA软件进行p53系统... p53作为关键肿瘤抑制蛋白参与了50%以上肿瘤的发生,本文对p53基本特性进行了初步地分析,通过分析p53氨基酸组成、疏水性表明p53蛋白具有酸性蛋白质、胶原蛋白、核蛋白、一些RNA结合模体等特征,整体呈现亲水性。利用MEGA软件进行p53系统发育分析,结果表明人p53与日本猕猴,食蟹猴,猕猴的p53亲缘关系高度相近。使用PSORT Ⅱ分析工具对p53亚细胞定位进行预测,表明p53蛋白主要分布在细胞核中。使用PRABI-GERLAND算法对p53二级结构进行预测,结果表明18.07%为α螺旋,18.07%为β折叠,63.87%为无规则卷曲。最后,采用同源建模(比较建模)方法构建了p53蛋白的三级结构,从建模质量评估表明预测结果准确。 展开更多
关键词 P53蛋白 系统发育分析 亚细胞定位预测 二级结构预测 三级结构预测
下载PDF
SOD1突变蛋白性质与结构分析
16
作者 徐愈强 《当代化工研究》 2019年第1期180-182,共3页
SOD1突变蛋白是最常见的引起肌萎缩性脊髓侧索硬化症(AmyotrophicLateralSclerosis,ALS)的原因之一,本文对SOD1基本特征进行了初步的分析,通过分析其核酸组成与疏水性发现其具有酸性蛋白质以及显著的胶原蛋白的特征,整体呈现亲水性。利... SOD1突变蛋白是最常见的引起肌萎缩性脊髓侧索硬化症(AmyotrophicLateralSclerosis,ALS)的原因之一,本文对SOD1基本特征进行了初步的分析,通过分析其核酸组成与疏水性发现其具有酸性蛋白质以及显著的胶原蛋白的特征,整体呈现亲水性。利用PSORTⅡ工具对SOD1亚细胞定位进行预测,数据表明,其在细胞中的分布均匀,在细胞质、细胞核中都有。使用MEGA我们做了进化树分析,结果表明人SOD1与灵长类动物进化关系最近。在最后,利用比较建模的方法构建了SOD1蛋白的三级结构,从结构来看表明预测结果准确。 展开更多
关键词 SOD1蛋白 亚细胞定位预测 三级结构预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部