期刊文献+
共找到48篇文章
< 1 2 3 >
每页显示 20 50 100
支持向量机在DNA微阵列数据分析中的应用研究
1
作者 周鹏 《计算机工程与设计》 CSCD 北大核心 2005年第11期2966-2968,2974,共4页
基于DNA微阵列实验,可以同时观测成千上万个基因的表达水平,使得人们能够在基因组水平上以系统的、全局的观念去研究生命现象及本质。支持向量机作为一种新的机器学习方法,最近几年在生物信息学领域得到了广泛的研究,在许多情况下,支持... 基于DNA微阵列实验,可以同时观测成千上万个基因的表达水平,使得人们能够在基因组水平上以系统的、全局的观念去研究生命现象及本质。支持向量机作为一种新的机器学习方法,最近几年在生物信息学领域得到了广泛的研究,在许多情况下,支持向量机取得了优于或接近其它方法的性能。就支持向量机在DNA微阵列的应用做一综述。 展开更多
关键词 生物信息学 dna微阵列 支持向量
下载PDF
基于粗糙集的支持向量机微阵列数据分类方法 被引量:4
2
作者 韩利 祁云嵩 王俊 《科学技术与工程》 2009年第1期152-155,共4页
DNA微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点。针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于粗糙集的支持向量机基因表达数据分类方法,该方法采用粗... DNA微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点。针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于粗糙集的支持向量机基因表达数据分类方法,该方法采用粗糙集进行基因特征约简,运用支持向量机进行数据分类,实验表明其分类效果良好。 展开更多
关键词 粗糙集 支持向量机dna微阵列 生物信息学
下载PDF
基于支持向量机的微阵列基因表达数据分析方法 被引量:8
3
作者 刘青 杨小涛 《小型微型计算机系统》 CSCD 北大核心 2005年第3期363-366,共4页
DNA微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点.针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于支持向量机的基因表达数据分类识别方法,该方法采用信噪比... DNA微阵列技术,使人们可以同时观测成千上万个基因的表达水平,对其数据的分析已成为生物信息学研究的焦点.针对微阵列基因表达数据维数高、样本小、非线性的特点,设计了一种基于支持向量机的基因表达数据分类识别方法,该方法采用信噪比进行基因特征提取,运用支持向量机的不同核函数进行性能测试,针对几个典型数据集的实验表明其识别效果良好. 展开更多
关键词 生物信息学 dna微阵列 基因表达谱 支持向量
下载PDF
基于遗传算法与支持向量机的基因微阵列分析 被引量:6
4
作者 汪伟 刘红 《中国组织工程研究与临床康复》 CAS CSCD 北大核心 2010年第17期3099-3103,共5页
背景:微阵列数据的特点是样本含量小,而变量数(基因)多达上万个。此时,传统的统计方法往往因为高维而失效了。遗传算法和支持向量机是近年来发展迅速的机器学习算法,具有很好的分类效果与降维优势。目的:提出将遗传算法与支持向量机结... 背景:微阵列数据的特点是样本含量小,而变量数(基因)多达上万个。此时,传统的统计方法往往因为高维而失效了。遗传算法和支持向量机是近年来发展迅速的机器学习算法,具有很好的分类效果与降维优势。目的:提出将遗传算法与支持向量机结合起来对样本进行分类,并与直接采用支持向量机、筛选差异表达基因后采用支持向量机的结果进行比较。方法:采用Bioconductor提供的数据集golub,它是白血病微阵列芯片实验所得的基因表达数据集,对全部基因采用支持向量机进行分类。采用SAM软件对芯片数据的显著性分析确定不同的差异表达基因并估计错误发现率FDR,以筛选出的76个差异表达基因作为特征基因子集,再采用支持向量机进行分类。将筛选出的76个差异表达基因作为初始的特征基因集合,采用遗传算法-支持向量机再次进行特征基因选择,提高分类准确度,并与全部基因直接采用支持向量机、筛选差异表达基因后采用支持向量机的结果进行比较。同时也对特征基因在代谢通路上的分布和功能作了一定的研究。结果与结论:通过遗传算法降维可以提高支持向量机的分类准确率,特别是剔除了数据中的大量无关基因和噪声,使得经过特征选择后分类准确率提高。结果显示遗传算法与支持向量机结合方法对分类更加有效。此外,通路分析结果显示特征基因的主要功能体现在信号传导和氨基酸代谢上。 展开更多
关键词 遗传算法 支持向量 微阵列 通路 数字化医学
下载PDF
基于最小二乘支持向量机微阵列基因特征分类 被引量:6
5
作者 高振斌 《计算机应用与软件》 北大核心 2019年第8期288-292,共5页
基因表达分析中的微阵列数据具有高维、高冗余的特点,给基因表达数据分类带来很大的困难。机器学习中的最小二乘支持向量机算法具有计算效率高的优势,从而为数据挖掘提供了一条有效途径。针对两类典型的癌症微阵列数据集(结肠癌集和白... 基因表达分析中的微阵列数据具有高维、高冗余的特点,给基因表达数据分类带来很大的困难。机器学习中的最小二乘支持向量机算法具有计算效率高的优势,从而为数据挖掘提供了一条有效途径。针对两类典型的癌症微阵列数据集(结肠癌集和白血病集),进行归一化预处理并且计算其相关系数矩阵;使用主成分分析法进行降维处理,得到用于特征选取和分类的信息基因集(各取 10个基因);采用最小二乘支持向量机分类器对信息基因集进行分类。实验结果表明,该算法在两类癌症数据集上的留一交叉检验的准确率分别为97.5%和100%,具有比其他分类器都高的测试准确率,为进一步医学临床应用提供可靠的诊断依据。 展开更多
关键词 微阵列 特征分类 降维 最小二乘支持向量
下载PDF
基于支持向量机的DNA序列分类系统的设计与实现 被引量:8
6
作者 蔡春 万潇楠 逯燕玲 《中国农业大学学报》 CAS CSCD 北大核心 2005年第2期58-64,共7页
针对传统统计方法进行DNA序列分类时要求DNA序列样本的概率分布函数已知,但多数情况下概率分布函数未知这一问题,采用支持向量机这一新的机器学习方法对DNA序列进行分类;以VB和Matlab为主要工具开发了基于支持向量机的DNA序列分类系统... 针对传统统计方法进行DNA序列分类时要求DNA序列样本的概率分布函数已知,但多数情况下概率分布函数未知这一问题,采用支持向量机这一新的机器学习方法对DNA序列进行分类;以VB和Matlab为主要工具开发了基于支持向量机的DNA序列分类系统。结果表明:该系统能够动态选择DNA训练样本、待测试样本,以及支持向量机模型中的参数,并根据用户的指定条件动态输出计算结果;对于预测一批已知正确分类答案的DNA序列,系统能够自动统计识别率,以观察参数变化对于算法执行结果的影响。 展开更多
关键词 dna序列分类 支持向量 动态化输入 动态化输出
下载PDF
基于支持向量机识别真核生物DNA中的翻译起始位点 被引量:3
7
作者 詹泳 周艳红 卢正鼎 《生物物理学报》 CAS CSCD 北大核心 2003年第4期437-440,共4页
翻译起始位点(TIS)的识别是真核生物基因预测的关键步骤之一,近年来一直得到研究人员的高度重视。基于TIS附近序列的统计特性,出现了一些辨识TIS的判别方法,但识别精度还有待进一步提高。针对传统支持向量机(SVM)方法中存在的不足,提出... 翻译起始位点(TIS)的识别是真核生物基因预测的关键步骤之一,近年来一直得到研究人员的高度重视。基于TIS附近序列的统计特性,出现了一些辨识TIS的判别方法,但识别精度还有待进一步提高。针对传统支持向量机(SVM)方法中存在的不足,提出了基于数据优化法的SVM,它通过其它统计学模型优化训练数据集,进而提高分类器的辨识精度。实验结果表明基于数据优化法的SVM分类器在翻译起始位点的辨识上可获得比其他判别方法更好的效果。 展开更多
关键词 支持向量 翻译起始位点 数据优化 敏感度 dna
下载PDF
基于机器学习的DNA序列分类研究
8
作者 保志康 陈继璇 +4 位作者 刘印晓 张茂源 章洪博 刘振安 魏晓娟 《生物化工》 CAS 2024年第3期20-27,共8页
DNA承载了生物体内的所有遗传信息,决定基因的结构和功能。对DNA所属类别进行预测,可以判断一个未知类是否为新物种、外来物种或者熟知物种。随着生物技术的发展,如何从获取到的DNA序列中提取完整信息并预测其序列组成,找到组成规律,准... DNA承载了生物体内的所有遗传信息,决定基因的结构和功能。对DNA所属类别进行预测,可以判断一个未知类是否为新物种、外来物种或者熟知物种。随着生物技术的发展,如何从获取到的DNA序列中提取完整信息并预测其序列组成,找到组成规律,准确反映物种特性成为生物信息学中的一个重要问题。本研究从NCBI网站上下载序列登录号为CP021707和CP085300的两类DNA序列文件,基于碱基频率和数量特征提取方法进行单碱基、双碱基和三碱基的特征提取,构建出84维、168维和35维特征向量,分别基于K近邻(K-Nearest Neighbor,KNN)、支持向量机(Support Vector Machine,SVM)以及K近邻和支持向量机融合(KNN-SVM)算法模型进行分类预测。实验结果表明,在168维特征向量下,基于KNN-SVM算法模型的分类准确率比基于KNN或SVM算法模型的分类准确率高,对判断一个未知类的相关特性具有积极意义。 展开更多
关键词 支持向量 dna序列 特征提取 K近邻 分类准确率
下载PDF
主成分分析和支持向量机在微阵列数据分析的应用
9
作者 黄紫成 《现代计算机(中旬刊)》 2013年第9期26-28,38,共4页
微阵列又称为基因芯片,基因芯片数据的特点是基因数多而样本数少,也就是变量数(或基因数)p远高于样本数n,表现出"大p,小n"。这对分析过程带来一定困难。实验表明,主成分分析方法能有效地解决这一问题。通过特征基因提取,提高... 微阵列又称为基因芯片,基因芯片数据的特点是基因数多而样本数少,也就是变量数(或基因数)p远高于样本数n,表现出"大p,小n"。这对分析过程带来一定困难。实验表明,主成分分析方法能有效地解决这一问题。通过特征基因提取,提高基因芯片数据分析的准确性。 展开更多
关键词 微阵列 主成分分析 支持向量
下载PDF
改进的支持向量机的DNA序列分类方法 被引量:1
10
作者 龚伏廷 《科技通报》 北大核心 2012年第6期136-137,140,共3页
针对传统的支持向量机在分类中不能够逼近任意的分类界面,而造成分类精度低的问题,本文在传统的支持向量机核函数基础上,提出了一种基于遗传算法优化的支持向量机结构模型,并将该方法应用在DNA序列分类上。实验结果表明了本文算法在同... 针对传统的支持向量机在分类中不能够逼近任意的分类界面,而造成分类精度低的问题,本文在传统的支持向量机核函数基础上,提出了一种基于遗传算法优化的支持向量机结构模型,并将该方法应用在DNA序列分类上。实验结果表明了本文算法在同等条件下要比传统的SVM分类方法具有更加优越的特征提取性能。 展开更多
关键词 支持向量 最小二乘法 dna序列 特征提取
下载PDF
双链DNA解链温度的最小二乘支持向量机预测方法 被引量:2
11
作者 李金松 张强 周士华 《计算机工程与应用》 CSCD 北大核心 2009年第5期55-58,共4页
在DNA计算中,为了确保计算结果的精度和可靠性,要求每个进行编码的DNA分子具有相同或者近似的热力学性质,解链温度Tm是评价DNA分子的热力学稳定性的一个重要的参数。以DNA序列的邻近法参数为基础,应用最小二乘支持向量机(LSSVM)的方法... 在DNA计算中,为了确保计算结果的精度和可靠性,要求每个进行编码的DNA分子具有相同或者近似的热力学性质,解链温度Tm是评价DNA分子的热力学稳定性的一个重要的参数。以DNA序列的邻近法参数为基础,应用最小二乘支持向量机(LSSVM)的方法对解链温度进行预测。结果表明,DNA序列的解链温度误差可以达到±5℃的范围。 展开更多
关键词 邻近法模型 解链温度 最小二乘法支持向量(LSSVM) dna计算
下载PDF
基于支持向量机的DNA序列相似性研究
12
作者 卢越 邱玉钦 周帅 《电子制作》 2014年第4X期43-43,共1页
为了解决传统的支持向量机在分类中不能够逼近任意的分类界面而造成分类精度低的目的,在传统的支持向量机核函数基础上,提出了一种基于遗传算法优化的支持向量机结构模型,并将该方法应用在DNA序列分类上。实验结果表明该算法在同等条件... 为了解决传统的支持向量机在分类中不能够逼近任意的分类界面而造成分类精度低的目的,在传统的支持向量机核函数基础上,提出了一种基于遗传算法优化的支持向量机结构模型,并将该方法应用在DNA序列分类上。实验结果表明该算法在同等条件下要比传统的SVM分类方法具有更加优越的特征提取性能。支持向量机能在概论分布函数未知的条件下对DNA序列进行分类。它主要考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题,半监督学习对于减少标注代价,提高学习机器性能具有非常重大的实际意义。 展开更多
关键词 dna序列相似性 支持向量 最小二乘法
下载PDF
grDNA-Prot:基于氨基酸物理化学特性和支持向量机的DNA结合蛋白预测
13
作者 张艳萍 倪建威 +2 位作者 高雅 陈鹏丞 李旭涛 《计算生物学》 2021年第1期1-11,共11页
DNA结合蛋白在细胞内外的各种活动中起着重要作用。本文提出一种新的DNA结合蛋白预测方法(grDNA-Prot),使用20个氨基酸组成频率和基于AAindex数据库531个氨基酸物理化学性质的图形表示法描述蛋白质序列信息。此外,还采用三种特征选择方... DNA结合蛋白在细胞内外的各种活动中起着重要作用。本文提出一种新的DNA结合蛋白预测方法(grDNA-Prot),使用20个氨基酸组成频率和基于AAindex数据库531个氨基酸物理化学性质的图形表示法描述蛋白质序列信息。此外,还采用三种特征选择方法来选择最优特征,并通过5折交叉验证,建立了基于支持向量机的DNA结合蛋白识别预测模型。为验证该方法的有效性,本文在独立测试数据集上与其他方法进行了比较。这些结果表明,Hydrophobicity (H)、Physicochemical properties (P)和Alpha and turn properties (A)是有效区分DNA结合蛋白和非DNA结合蛋白的主要氨基酸物理化学性质。 展开更多
关键词 dna结合蛋白 物理化学性质 图形表示法 特征选择 支持向量
下载PDF
基于3种基因启动子甲基化联合端粒长度构建肺癌诊断支持向量机模型 被引量:9
14
作者 王威 冯晓蕾 +4 位作者 段晓冉 王团伟 谭善娟 吴逸明 吴拥军 《郑州大学学报(医学版)》 CAS 北大核心 2015年第4期462-465,共4页
目的::探讨基于外周血白细胞 DNA FHIT、RASSF1A 和 p16基因启动子甲基化水平以及 DNA 端粒长度等4项生物标志建立的支持向量机模型在肺癌诊断中的意义。方法:通过实时定量甲基化特异性 PCR 法,测定200例正常人(对照组)和200例肺... 目的::探讨基于外周血白细胞 DNA FHIT、RASSF1A 和 p16基因启动子甲基化水平以及 DNA 端粒长度等4项生物标志建立的支持向量机模型在肺癌诊断中的意义。方法:通过实时定量甲基化特异性 PCR 法,测定200例正常人(对照组)和200例肺癌患者外周血白细胞 DNA 中 FHIT、RASSF1A 和 p16基因启动子甲基化水平,实时荧光定量 PCR 方法测定外周血 DNA 相对端粒长度,基于上述4种生物标志构建肺癌诊断支持向量机模型。结果:肺癌组和对照组中 FHIT、RASSF1A 和 p16基因启动子甲基化水平分别为3.33(1.86~6.40)和2.85(1.39~5.44),27.62(9.09~52.86)和17.17(3.86~50.87),0.59(0.16~4.50)和0.36(0.06~4.00),端粒长度分别为(0.93±0.32) kb 和(1.16±0.57) kb,两组间差异有统计学意义(Z =3.044、2.075、2.641和4.972,P 均〈0.05)。基于上述4项生物标志建立的判别分析和支持向量机模型对预测集的 ROC 曲线下面积及95% CI 分别为0.670(0.569~0.761)和0.810(0.719~0.882)。结论:成功构建基于 p16、RASSF1A、FHIT 基因启动子甲基化和端粒长度的肺癌诊断支持向量机模型。 展开更多
关键词 脆性组氨酸三联体基因 p16 dna 甲基化 端粒 肺癌 支持向量
下载PDF
基于DNA微阵列数据的特征子空间集成分类 被引量:3
15
作者 于化龙 顾国昌 +2 位作者 赵靖 刘海波 沈晶 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第4期1071-1076,共6页
针对DNA微阵列数据应用于临床诊断时分类准确率过低的问题,结合其高维小样本的特点提出了一种特征子空间集成分类方法。该方法首先通过层次聚类与信噪比特征选择策略将原始训练数据集映射到一个非冗余的特征基因空间,然后随机抽取一些... 针对DNA微阵列数据应用于临床诊断时分类准确率过低的问题,结合其高维小样本的特点提出了一种特征子空间集成分类方法。该方法首先通过层次聚类与信噪比特征选择策略将原始训练数据集映射到一个非冗余的特征基因空间,然后随机抽取一些特征子空间构成训练子集并应用支持向量机训练基分类器,最后采用多数投票的方式决定测试样本的类属。最后在4个标准的微阵列数据集上与其他方法进行了对比实验,结果证明了本文方法的有效性。 展开更多
关键词 计算应用 集成分类 特征子空间 dna微阵列数据 支持向量
下载PDF
基于最小二乘模糊支持向量机的基因分类研究 被引量:6
16
作者 骆嘉伟 苏涵沐 陈涛 《计算机应用研究》 CSCD 北大核心 2010年第2期459-461,共3页
随着大量基因表达数据的涌现,把海量的数据划分成数量相对较少的组,有助于提取对生理学和医药学等有价值的生物信息。基因分类技术能够很好地处理和分析这些基因数据。提出了一种应用于基因分类的模糊最小二乘支持向量机方法,通过设置... 随着大量基因表达数据的涌现,把海量的数据划分成数量相对较少的组,有助于提取对生理学和医药学等有价值的生物信息。基因分类技术能够很好地处理和分析这些基因数据。提出了一种应用于基因分类的模糊最小二乘支持向量机方法,通过设置模糊隶属度改变分类中样本的贡献属性。该方法不仅考虑了样本与类中心点的距离关系,还充分考虑样本与样本之间的关系,减弱噪声或野值样本对分类的影响。采用美国威斯康星乳腺癌数据和皮马印第安人糖尿病数据进行实验检测,均取得了很好的效果。 展开更多
关键词 基因微阵列 基因分类 最小二乘 隶属度函数 模糊支持向量
下载PDF
DNA微阵列数据特征提取的分类方法研究 被引量:1
17
作者 彭红毅 叶燕锐 +2 位作者 张俊辉 罗泽举 奉国和 《计算机工程与应用》 CSCD 北大核心 2010年第28期40-42,共3页
常用的排列方法从DNA微数据中选择的基因集合往往会包含相关性较高的基因,而且使用单个基因评价方法也不能真正反映由此得到的特征集合分类能力的优劣。另外,基因数量远多于样本数量是进行疾病诊断面临的又一挑战。为此,提出一种DNA微... 常用的排列方法从DNA微数据中选择的基因集合往往会包含相关性较高的基因,而且使用单个基因评价方法也不能真正反映由此得到的特征集合分类能力的优劣。另外,基因数量远多于样本数量是进行疾病诊断面临的又一挑战。为此,提出一种DNA微阵列数据特征提取方法用于组织分类。该方法运用K-means方法对基因进行聚类分析,获取各子类DNA微阵列数据中心,用排列法去除对分类无关的子类,然后利用ICA方法提取剩余子类集合的特征,用SVMs方法构造分类器对组织进行分类。真实的生物学数据实验表明,该方法通过提取一种复合基因,能综合评价基因分类能力,减少特征数,提高分类器的分类准确性。 展开更多
关键词 dna微阵列 特征提取 独立成分分析(ICA) 聚类分析 支持向量(SVMs)
下载PDF
基于自适应双正则化支持向量机的群体基因选择 被引量:1
18
作者 陈留院 穆晓霞 李钧涛 《郑州大学学报(理学版)》 CAS 北大核心 2014年第1期73-77,共5页
通过结合部分自适应弹性网络惩罚和hinge损失函数,提出了一种能同时进行微阵列分类和基因选择的自适应双正则化支持向量机模型,并证明了该支持向量机具有自适应群体基因选择性能.
关键词 支持向量 微阵列分类 基因选择
下载PDF
基于支持向量机的肿瘤基因数据挖掘 被引量:1
19
作者 于彬 《科学技术与工程》 2009年第24期7370-7372,共3页
针对两种类别的肿瘤分类问题,首先运用信噪比方法筛选出表达水平发生显著性变化的特征基因,然后采用支持向量机作为分类器进行肿瘤分类,通过对两种类别的白血病DNA微阵列数据进行计算,达到了97.1%的分类准确度。
关键词 dna微阵列 支持向量 分类
下载PDF
基于最优正交质心特征选取的DNA微阵列数据分析
20
作者 钱夕元 倪中新 邵志清 《华东理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第2期233-237,共5页
微阵列数据具有样本小、维度高的特点,给数据分析带来了困难。因此,在生物信息学的研究和应用中,从微阵列数据里挑选主基因(特征选取)是十分重要和有意义的。本文采用基于最优正交质心特征选取算法(OCFS)来挑选主基因,并与基于信噪比的... 微阵列数据具有样本小、维度高的特点,给数据分析带来了困难。因此,在生物信息学的研究和应用中,从微阵列数据里挑选主基因(特征选取)是十分重要和有意义的。本文采用基于最优正交质心特征选取算法(OCFS)来挑选主基因,并与基于信噪比的主基因挑选法和基于遗传算法的主基因挑选法进行了对比。利用挑选出的主基因,采用支持向量机(SVM)对数据样本进行了分类研究。通过实验,在经典的白血病数据集上,对于34个样本的测试集,达到了33/34的分类准确率,表明了本方法的适用性。 展开更多
关键词 最优正交质心 特征选取 特征萃取 dna微阵列 支持向量
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部