期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
酵母基因组核小体定位序列预测 被引量:1
1
作者 胡世赛 陈宇翔 +1 位作者 张颖 吕军 《生物物理学》 2018年第1期1-6,共6页
核小体是染色质结构的基本单位,其在整条DNA序列上的定位分布情况,对于真核生物的基因表达调控起关键作用。用机器学习方法预测核小体定位成为近年来的研究热点。以DNA序列6-mer组分为参数,采用我们提出的多样性增量特征选择技术,筛选出... 核小体是染色质结构的基本单位,其在整条DNA序列上的定位分布情况,对于真核生物的基因表达调控起关键作用。用机器学习方法预测核小体定位成为近年来的研究热点。以DNA序列6-mer组分为参数,采用我们提出的多样性增量特征选择技术,筛选出8个6-mer作为分类特征。进一步,采用支持向量机算法,10折交叉检验的总精度达到98.2%。结果表明,核小体定位序列和连接序列核苷k-mer组分的特异化分布,是影响酵母核小体定位的主要因素。 展开更多
关键词 核小体定位序列 多样性增量 特征选择技术
下载PDF
用多样性增量特征选择技术识别蛋白质磷酸化位点
2
作者 胡世赛 梁珍 +2 位作者 陈宇翔 张颖 吕军 《计算生物学》 2018年第1期24-32,共9页
磷酸化是最重要的蛋白质翻译后修饰之一,在许多细胞过程中扮演重要角色。发展磷酸化位点精确识别的计算生物学方法,有助于对磷酸化信号转导机制的理解。本文给出一种激酶无关的磷酸化位点识别模型,称为FSID_PhSite。模型以k间隔氨基酸... 磷酸化是最重要的蛋白质翻译后修饰之一,在许多细胞过程中扮演重要角色。发展磷酸化位点精确识别的计算生物学方法,有助于对磷酸化信号转导机制的理解。本文给出一种激酶无关的磷酸化位点识别模型,称为FSID_PhSite。模型以k间隔氨基酸对组分和位置保守氨基酸组分为特征,应用多样性增量特征选择技术进行特征筛选,将选出的特征输入到支持向量机算法进行识别。在正负样本数之比为1:1的情形下,对磷酸化丝氨酸、苏氨酸和酪氨酸在独立测试集检验,识别精度分别达到84.34%、82.32%和68.89%。结果优于现有的激酶无关磷酸化位点识别模型。 展开更多
关键词 蛋白质磷酸化位点 多样性增量特征选择 支持向量机
下载PDF
用主链局域结构关联特征识别疟原虫分泌蛋白
3
作者 陈宇翔 李彦儒 +1 位作者 张颖 吕军 《内蒙古工业大学学报(自然科学版)》 2018年第5期332-339,共8页
应用生物信息学方法识别疟原虫分泌蛋白和非分泌蛋白,为了提供快速的抗疟疾药物和疫苗的设计药物靶标筛选手段,采用径向核函数支持向量机进行疟原虫分泌蛋白和非分泌蛋白的分类识别.Jackknife检验结果表明,敏感性为85%,特异性为90%,总... 应用生物信息学方法识别疟原虫分泌蛋白和非分泌蛋白,为了提供快速的抗疟疾药物和疫苗的设计药物靶标筛选手段,采用径向核函数支持向量机进行疟原虫分泌蛋白和非分泌蛋白的分类识别.Jackknife检验结果表明,敏感性为85%,特异性为90%,总精度为88%.与现有的其它模型相比,在保证较高识别精度的前提下,大幅降低了模型所使用的特征数,增强了识别模型的鲁棒性.构建精度高且鲁棒性好的药物靶标蛋白质生物信息学识别模型,一方面可以为理解蛋白质功能机制提供有价值的线索,另一方面可作为针对病源蛋白进行药物和疫苗设计的快速筛查手段. 展开更多
关键词 疟原虫分泌蛋白 主链局域结构 多样性增量特征选择技术 分类识别
下载PDF
一种基于群体增量学习算法的文本特征选择方法
4
作者 罗毅辉 熊曙初 《图书情报工作》 CSSCI 北大核心 2011年第24期102-105,125,共5页
尽管目前存在许多文本特征选择方法,但是它们都有着一定的局限性。提出一种新的基于群体增量学习(Population Based Incremental Learning)算法的文本特征选择方法,其特点是无需特征集的先验知识和容易实现,并且由于使用了简单分类器性... 尽管目前存在许多文本特征选择方法,但是它们都有着一定的局限性。提出一种新的基于群体增量学习(Population Based Incremental Learning)算法的文本特征选择方法,其特点是无需特征集的先验知识和容易实现,并且由于使用了简单分类器性能作为评价准则,计算复杂度很低。对Reuters-21578文本集的分类实验结果表明,该方法平均分类性能要优于卡方统计量、信息增益和简单遗传算法三种常用的特征选择方法。 展开更多
关键词 群体增量学习 特征选择 文本分类 遗传算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部