-
题名基因表达时序数据的HMM层次聚类
被引量:1
- 1
-
-
作者
赵国庆
邓伟
-
机构
苏州大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第32期167-169,共3页
-
文摘
DNA微阵列技术的应用产生了大量的基因表达时序数据,对这些数据进行聚类是获取其中隐含的生物分子信息的一种重要方法。提出了一种基于隐马尔可夫模型(HMM)的层次聚类方法,根据基因表达时序数据的统计特性对其进行标准化和离散化等预处理,用HMM对经过预处理的数据建模以利用基因表达时序数据不同时间点之间的相关性,用层次聚类方法对建立的模型进行聚类。实验结果表明该方法不仅能够产生好的聚类,而且能够确定最优的聚类数。
-
关键词
基因表达时序数据
统计特性
隐马尔可夫模型
层次聚类
-
Keywords
gene expression time series data
statistics
Hidden Markov Model(HMM)
hierarchical clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于离散时序基因表达数据的双聚类算法
被引量:1
- 2
-
-
作者
许涛
尚学群
杨蜜静
王淼
-
机构
西北工业大学计算机学院计算机软件与理论系
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第12期3551-3556,3567,共7页
-
基金
国家"973"计划资助项目(2012CB316203)
国家自然科学基金资助项目(61272121)
-
文摘
目前应用于基因表达数据上的双聚类算法大多是基于真实数据提出的,因此易受噪声干扰,且这些算法很少考虑样本间的时序性。提出了一种有效的时间点连续的双聚类挖掘算法DTCB,从离散的时序基因表达数据中挖掘出时间点连续的最大共表达双聚类。该算法使用了一种新的数据离散化方法,同时提出了三种在离散数据集下基因间的共表达关系;为了提高挖掘效率,DTCB使用了有效的剪枝和输出策略,可以在不产生候选集的情况下一次性挖掘出所有的最大共表达双聚类。通过实验分析,证明DTCB具有高效的性能和良好的鲁棒性,且结果具有较好的统计和生物意义。
-
关键词
时序基因表达数据
双聚类
共表达
时间点连续
离散化
-
Keywords
time-series gene expression data
bicluster
co-expression
time-continuous
discretization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名改进的时序基因表达数据动态聚类算法
- 3
-
-
作者
刘宇宏
王士同
徐红林
-
机构
江南大学信息工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第27期164-167,共4页
-
文摘
文[1]采用了一种基于动态模型的聚类算法,将时序基因表达数据作为一组时间序列进行动态的聚类分析,得到了较为理想的聚类结果。对上述算法在数据初始化方面进行了合理改进,并利用贝叶斯理论对数据的联合概率分布进行了重新分析。实验表明,提出的改进算法所得聚类结果明显优于原算法所得结果。
-
关键词
时序基因表达数据
自回归模型
动态模型
贝叶斯理论
-
Keywords
tlme-course gene expression
autoregressive equatlon
dynamlc model
Bayes theory
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种模糊相似关系的基因表达数据聚类方法
被引量:2
- 4
-
-
作者
姜永森
陆媛
杨慧中
-
机构
北华大学科研处
江南大学物联网工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第8期236-238,共3页
-
基金
国家自然科学基金(No.60674029)~~
-
文摘
对于时间序列的基因表达数据,传统的聚类算法都是以距离为相似性度量标准,没有考虑基因随时间变化的相似趋势。从基因变化的趋势出发,构造了一种新的模糊相似关系矩阵,提出了改进的基于模糊相似关系的聚类算法,并以该算法计算FCM的初始聚类中心。将该方法应用在酵母菌基因表达数据中,实验结果表明该算法不仅克服了FCM算法易陷入局部极小值、对初值敏感的缺点,而且能够发现一些表达模式变化趋势相似的共调控基因。
-
关键词
模糊相似关系矩阵
聚类中心
模糊C均值聚类(FCM)算法
时序基因表达数据
-
Keywords
fuzzy similar relation matrix cluster centers Fuzzy C-Means(FCM) algorithm time series gene expression data
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于惯性法则的基因调控网络推断
- 5
-
-
作者
应文豪
王士同
-
机构
江南大学信息工程学院
常熟理工学院计算机科学与工程系
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第33期211-214,231,共5页
-
文摘
结合基因调控网络本身的非线性特征,提出了一个改进型的基于惯性法则的微分动力学模型,并证明其具有递归神经网络特征。使用DNA修复网络的一组时序基因表达数据进行仿真实验,实验中用粒子群优化算法优化网络参数,得到了较有意义的结果。
-
关键词
惯性法则
基因调控网络
粒子群优化算法
DNA修复网络
时序基因表达数据
-
Keywords
inertia principle
gene regulatory networks
particle swarm optimization
DNA repair networks
time series gene expression data
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于AR模型的动态模糊聚类算法
被引量:1
- 6
-
-
作者
刘宇宏
王士同
徐红林
-
机构
江南大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第1期144-147,159,共5页
-
基金
江苏省自然科学基金项目(BK2003017)
教育部跨世纪优秀人才培养计划基金项目(NCET-04-0496)
-
文摘
与传统的硬划分聚类相比,模糊聚类算法(以FCM为例)对数据的比例变化具有鲁棒性,能够更准确地反映数据点与类中心的实际关系,目前已得到广泛应用。然而对于时序基因表达数据来说,传统的聚类算法往往不能充分利用到数据中时间上的动态关联信息。因此可以在模糊聚类算法的基础上引入自回归(AR)模型,将时序基因表达数据作为一组时间序列进行动态的聚类分析。这样不仅可以充分利用到时序基因表达数据的内部自相关性,并且可以进一步利用隶属度函数对AR模型的预测过程进行模糊化调整,从而得到更为理想的聚类结果。
-
关键词
自回归模型
模糊聚类
时序基因表达数据
动态模糊聚类
自相关性
-
Keywords
autoregressive model
fuzzy clustering
time-course gene expression
dynamic fuzzy clustering
self-relationship
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-