期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于模糊c-均值聚类的微阵列基因表达数据分析 被引量:8
1
作者 宫改云 毛用才 +1 位作者 高新波 刘三阳 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2004年第2期291-295,共5页
微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c 均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种... 微阵列技术已成为染色体研究的主要工具,但是它所面临的挑战是如何对海量数据进行分析.利用模糊c 均值聚类对这些数据进行分析,从而发现有差异的基因表达.结果表明,模糊聚类是一种用来为微阵列基因表达数据寻找有差异的基因表达的一种有用工具. 展开更多
关键词 模糊C-均值聚类 微阵列基因表达数据 差异基因表达 微阵列DNA芯片
下载PDF
粒计算在基因微阵列数据特征选择中的应用
2
作者 王俊 祁云嵩 韩利 《科学技术与工程》 2009年第6期1424-1427,1455,共5页
对于许多模式识别问题来说,特征选择是一个非常重要的数据预处理技术,这对于维数高,而样本又相对较小的微阵列数据来说更是如此。提出一种将粒计算与传统的SVM-RFE算法相结合的特征选择算法。这种算法能够有效地去除大部分与分类无关的... 对于许多模式识别问题来说,特征选择是一个非常重要的数据预处理技术,这对于维数高,而样本又相对较小的微阵列数据来说更是如此。提出一种将粒计算与传统的SVM-RFE算法相结合的特征选择算法。这种算法能够有效地去除大部分与分类无关的基因;并且能够搜索到基因数量相对较少而分类能力相对较强的信息基因子集。 展开更多
关键词 微阵列基因表达数据 特征选择 粒计算 SVM-RFE算法
下载PDF
基于非负矩阵分解的大脑不同区域基因表达数据分析 被引量:1
3
作者 孔薇 陶伟杰 牟晓阳 《中国生物医学工程学报》 CAS CSCD 北大核心 2012年第6期875-881,共7页
基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。针对阿尔茨海默症(AD)起病隐匿、诊断难、发病机理复杂以及基因信号传导通路和调控关系难以重建等特征,利用非平滑非负矩阵分解(nsNMF)方法提取AD致病基因... 基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。针对阿尔茨海默症(AD)起病隐匿、诊断难、发病机理复杂以及基因信号传导通路和调控关系难以重建等特征,利用非平滑非负矩阵分解(nsNMF)方法提取AD致病基因,聚类过程中利用共表型相关性系数(CCC)选取聚类数k的值,得到最优的聚类数目。针对基因表达数据噪声高、信息变量隐藏难分析的困难,考虑AD的发生发展与许多大脑功能区域密切相关的特性,提出将nsNMF分别应用于AD患者的大脑海马区、内嗅区皮质、颞中回及视觉皮层区的基因表达数据中,共提取3 800个显著基因,其中包括确定与AD致病机理有关联的10个致病基因,并进行了生物学分析,得到了AD相关的细胞凋亡、代谢及炎症反应等生物过程,显示nsNMF方法及大脑多区域数据集的联合分析能更全面地探寻AD信号传导关系及基因调控方式。 展开更多
关键词 微阵列基因表达数据 非负矩阵分解 阿尔茨海默病
下载PDF
基于FCBF特征选择和集成优化学习的基因表达数据分类算法 被引量:6
4
作者 马超 《计算机应用研究》 CSCD 北大核心 2019年第10期2986-2991,共6页
针对微阵列基因表达数据高维小样本、高冗余且高噪声的问题,提出一种基于FCBF特征选择和集成优化学习的分类算法FICS-EKELM。首先使用快速关联过滤方法FCBF滤除部分不相关特征和噪声,找出与类别相关性较高的特征集合;其次,运用抽样技术... 针对微阵列基因表达数据高维小样本、高冗余且高噪声的问题,提出一种基于FCBF特征选择和集成优化学习的分类算法FICS-EKELM。首先使用快速关联过滤方法FCBF滤除部分不相关特征和噪声,找出与类别相关性较高的特征集合;其次,运用抽样技术生成多个样本子集,在每个训练子集上利用改进乌鸦搜索算法同步实现最优特征子集选择和核极限学习机KELM分类器参数优化;然后基于基分类器构建集成分类模型对目标数据进行分类识别;此外运用多核平台多线程并行方式进一步提高算法计算效率。在六组基因数据集上的实验结果表明,该算法不仅能用较少特征基因达到较优的分类效果,并且分类结果显著高于已有和相似方法,是一种有效的高维数据分类方法。 展开更多
关键词 特征选择 集成学习 微阵列基因表达数据 乌鸦搜索算法 核极限学习机
下载PDF
基于大脑不同区域的阿尔茨海默症基因表达数据分析 被引量:2
5
作者 孔薇 牟晓阳 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第6期994-997,1002,共5页
提出了采用Tukey双权函数作为FastICA(Fast Independent Component Analysis)方法的非线性函数,对阿尔茨海默症(Alzheimer’s disease,AD)多个脑区域基因表达数据进行显著基因提取,揭示其基因表达调控关系.针对传统聚类方法基于全局聚... 提出了采用Tukey双权函数作为FastICA(Fast Independent Component Analysis)方法的非线性函数,对阿尔茨海默症(Alzheimer’s disease,AD)多个脑区域基因表达数据进行显著基因提取,揭示其基因表达调控关系.针对传统聚类方法基于全局聚类且只能将某个基因聚类到某一类的缺陷,改进的FastICA方法能够对基因表达数据进行快速有效的双向聚类,能够满足同一个基因可能参与不同信号传导通路的生物特性.同时考虑到人脑中海马区、内嗅皮质区、颞中回及视觉皮层区均与学习与记忆功能密切相关,将算法对多个脑区域进行基因表达调控综合分析.结果表明,大量炎症反应是AD致病的重要因素之一. 展开更多
关键词 微阵列基因表达数据 阿尔茨海默症 独立成分分析 基因调控网络
下载PDF
基于小波包变换的基因微阵列数据预处理方法
6
作者 夏遥 孔薇 《现代生物医学进展》 CAS 2011年第S1期4742-4747,共6页
目的:基于阿尔茨海默病微阵列基因表达数据,分析研究微阵列基因表达数据预处理的新的有效方法。方法:首先采用标准差滤波、FSC(特征记分准则)和WPT-SAM(小波包变换-微阵列数据显著性分析)方法对微阵列基因表达数据进行预处理,比较处理... 目的:基于阿尔茨海默病微阵列基因表达数据,分析研究微阵列基因表达数据预处理的新的有效方法。方法:首先采用标准差滤波、FSC(特征记分准则)和WPT-SAM(小波包变换-微阵列数据显著性分析)方法对微阵列基因表达数据进行预处理,比较处理后获得的基因数和FDR值;然后采用分类聚类方法对处理后的数据进行分类聚类和分层决策聚类,比较分类聚类结果。结果:标准差滤波和FSC方法获得的初筛基因数据较WPT-SAM方法多,但FDR值也高、后续分类聚类结果较WPT-SAM方法差。结论:WPT-SAM方法在预处理微阵列基因表达数据中,是比较灵活理想的分析方法。 展开更多
关键词 微阵列基因表达数据 分类聚类 WPT-SAM
原文传递
基于矩阵分解技术的显著基因提取及基因表达数据分析
7
作者 孔薇 王娟 牟晓阳 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2014年第3期662-670,共9页
基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。因此,可以根据基因表达数据对基因调控状态进行建模,以挖掘具有生物学意义的信息及隐含在其中的基因调控关系。本文分别利用独立成分分析(ICA)和非负矩阵... 基因之间存在多种多样的表达调控活动,一般认为这些调控关系隐含在基因表达谱中。因此,可以根据基因表达数据对基因调控状态进行建模,以挖掘具有生物学意义的信息及隐含在其中的基因调控关系。本文分别利用独立成分分析(ICA)和非负矩阵分解(NMF)这两种无监督矩阵分解技术对阿尔茨海默病(AD)基因表达数据进行显著基因提取及基因调控网络的构建,通过生物学分析,探讨了两种不同矩阵分解技术在挖掘潜在致病基因上的作用,通过结合两种方法所提取的显著基因的生物学分析,体现了炎症反应在AD致病机制中的重要作用,为AD早期诊断、致病机制研究及基因生物标志物的探寻提供了有益的方法。 展开更多
关键词 矩阵分解 微阵列基因表达数据 独立成分分析 非负矩阵分解 阿尔茨海默病
原文传递
Classification analysis of microarray data based on ontological engineering 被引量:2
8
作者 LI Guo-qi SHENG Huan-ye 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2007年第4期638-643,共6页
Background knowledge is important for data mining, especially in complicated situation. Ontological engineering is the successor of knowledge engineering. The sharable knowledge bases built on ontology can be used to ... Background knowledge is important for data mining, especially in complicated situation. Ontological engineering is the successor of knowledge engineering. The sharable knowledge bases built on ontology can be used to provide background knowledge to direct the process of data mining. This paper gives a common introduction to the method and presents a practical analysis example using SVM (support vector machine) as the classifier. Gene Ontology and the accompanying annotations compose a big knowledge base, on which many researches have been carried out. Microarray dataset is the output of DNA chip. With the help of Gene Ontology we present a more elaborate analysis on microarray data than former researchers. The method can also be used in other fields with similar scenario. 展开更多
关键词 Ontological engineering Data mining MICROARRAY Support vector machine (SVM)
下载PDF
Normalization strategy of microarray gene expression data
9
作者 伍亚舟 张玲 +2 位作者 黄明辉 杨梦苏 易东 《Journal of Medical Colleges of PLA(China)》 CAS 2007年第4期195-200,共6页
Objective: To discuss strategies and methods of normalization on how to deal with and analyze data for different chips with the combination of statistics, mathematics and bioinformatics in order to find significant d... Objective: To discuss strategies and methods of normalization on how to deal with and analyze data for different chips with the combination of statistics, mathematics and bioinformatics in order to find significant difference genes. Methods: With Excel and SPSS software, high or low density chips were analyzed through total intensity normalization (TIN) and locally weighted linear regression normalization (LWLRN). Results: These methods effectively reduced systemic errors and made data more comparable and reliable. Conclusion: These methods can search the genes of significant difference, although normalization methods are being developed and need to be improved further. Great breakthrough will be obtained in microarray data normalization analysis and transformation with the development of non-linear technology, software and hardware of computer. 展开更多
关键词 gene chip normalization factor expression ratio significant difference
下载PDF
基于一种集成的信息基因选择方法的乳腺肿瘤识别研究 被引量:1
10
作者 杨晓慧 白欣宇 +1 位作者 乔江华 陆寓非 《中国肿瘤》 CAS CSCD 北大核心 2019年第7期557-562,共6页
[目的]探讨导致乳腺癌的可能致病基因及其生物学意义。[方法]基于国际上通用的乳腺癌公共测试集Breast-2 (79)数据库,提出了一种集成的决策信息因子(decision information factor,DIF)方法,以有效地选择出候选致病基因,并完成乳腺癌识... [目的]探讨导致乳腺癌的可能致病基因及其生物学意义。[方法]基于国际上通用的乳腺癌公共测试集Breast-2 (79)数据库,提出了一种集成的决策信息因子(decision information factor,DIF)方法,以有效地选择出候选致病基因,并完成乳腺癌识别。基于R语言对原始基因数据做加权共表达网络分析以识别网络中的重要基因模块;使用DAVID软件对重要基因模块进行Pathway富集分析,验证是否具有统计学意义;使用DIF方法从具有统计学意义的重要基因模块中选择出2个候选致病基因;借助反空间稀疏表示分类模型完成乳腺癌识别。[结果]通过加权基因共表达网络得到3个基因模块,其中2个经Pathway富集分析检验具有统计学意义,在这两个模块上采用DIF基因选择方法选出的2个候选致病基因用于乳腺癌识别时,准确率达到71.07%,比信噪比(signal noise ratio,SNR)、受试者工作特征曲线(receiver operating characteristic curve,ROC)、组内与组间平方和比率(the ratio of between-groups to within-groups sum of squares,BW)的方法分别高出13.93%、11.19%和8.57%。[结论]该文提出的集成DIF基因选择方法得到的候选致病基因能有效识别乳腺癌,并具有明确的生物学意义。 展开更多
关键词 乳腺癌 微阵列基因表达数据 加权基因表达网络 决策信息因子 反空间稀疏表示
原文传递
PCA和PLS应用于胃癌亚型分类研究 被引量:3
11
作者 李建更 李萍 +1 位作者 李君 阮晓钢 《生物物理学报》 CAS CSCD 北大核心 2009年第2期141-147,共7页
文章研究了基于微阵列基因表达数据的胃癌亚型分类。微阵列基因表达数据样本少、纬度高、噪声大的特点,使得数据降维成为分类成功的关键。作者将主成分分析(PCA)和偏最小二乘(PLS)两种降维方法应用于胃癌亚型分类研究,以支持向量机(SVM)... 文章研究了基于微阵列基因表达数据的胃癌亚型分类。微阵列基因表达数据样本少、纬度高、噪声大的特点,使得数据降维成为分类成功的关键。作者将主成分分析(PCA)和偏最小二乘(PLS)两种降维方法应用于胃癌亚型分类研究,以支持向量机(SVM)、K-近邻法(KNN)为分类器对两套胃癌数据进行亚型分类。分类效果相比传统的医理诊断略高,最高准确率可达100%。研究结果表明,主成分分析和偏最小二乘方法能够有效地提取分类特征信息,并能在保持较高的分类准确率的前提下大幅度地降低基因表达数据的维数。 展开更多
关键词 主成分分析 偏最小二乘 分类 胃癌 微阵列基因表达数据
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部