动脉粥样硬化是因脂质堆积在血管壁上并受到多种遗传和环境因素影响的一种复杂的病理生理疾病。动脉粥样硬化风险疾病基因的辨识可以增进对该疾病机理的了解,并对该疾病的诊断和治疗起到指导性作用。虽然在风险疾病基因的辨识方面已经...动脉粥样硬化是因脂质堆积在血管壁上并受到多种遗传和环境因素影响的一种复杂的病理生理疾病。动脉粥样硬化风险疾病基因的辨识可以增进对该疾病机理的了解,并对该疾病的诊断和治疗起到指导性作用。虽然在风险疾病基因的辨识方面已经提出了很多计算方法,但仍存在着推论准确性和计算效率方面的问题。一种命名为基于熵聚类和双重筛选(Entropy-based clustering and double screening,ECDS)的新方法被用来辨识该疾病的风险疾病基因。该方法将功能基因组信息和蛋白质相互作用网络拓扑结构信息进行整合,运用于基于熵聚类的方法中,之后,使用双重筛选策略(即支持向量机和相似性得分)进行风险疾病基因挖掘。运用该方法,从巨噬细胞样本和泡沫细胞样本中分别辨识出79个和113个风险疾病基因。该结果表明ECDS在辨识动脉粥样硬化风险疾病基因方面非常有效。此外,该方法也很易于扩展应用到其它复杂疾病的风险基因辨识中。展开更多
为了克服传统多目标演化算法在进化后期遗传操作可能失效使算法性能降低以及基于概率建模的多目标算法在演化初期由于种群分布尚未呈现一定规律,采样产生的新个体的搜索方向同目标方向存在差异,提出一种基于熵值的多目标演化算法(entrop...为了克服传统多目标演化算法在进化后期遗传操作可能失效使算法性能降低以及基于概率建模的多目标算法在演化初期由于种群分布尚未呈现一定规律,采样产生的新个体的搜索方向同目标方向存在差异,提出一种基于熵值的多目标演化算法(entropy based multi-objective evolutionary algorithm,EB-MOEA)。算法利用种群进化过程中,个体分布存在从无序到有序的现象,设计了一种基于熵值理论的种群分布计算方法,并将其作为种群从无序到有序过渡的判定准则,指导遗传操作和概率建模操作切换的时机。新算法采用ZDT、DTLZ系列测试集进行实验,通过与NSGA-Ⅱ以及RM-MEDA算法的实验对比,证明了新判断准则的有效性,EB-MOEA具有更好的寻优性能。展开更多
随着Web 所拥有的信息量和信息种类的急剧增长,Web 站点挖掘对于自动实现特定主题的 Web 资源发现和分类具有重要的意义.然而现有的 Web 站点分类或挖掘算法在利用上下文语义信息、去除噪声信息以进一步提高分类准确率等方面还缺乏深入...随着Web 所拥有的信息量和信息种类的急剧增长,Web 站点挖掘对于自动实现特定主题的 Web 资源发现和分类具有重要的意义.然而现有的 Web 站点分类或挖掘算法在利用上下文语义信息、去除噪声信息以进一步提高分类准确率等方面还缺乏深入研究.从站点的采样尺寸、分析粒度和描述结构 3 个方面分析了设计高效的 Web 站点挖掘算法所需要解决的问题.在此基础上,提出了一种新的 Web 站点多粒度树描述模型,并描述了包括基于隐 Markov 树的两阶段分类算法、粒度间上下文融合算法、两阶段去噪程序以及基于熵的动态剪枝策略在内的多粒度 Web 站点挖掘算法.站点的多粒度描述方法及挖掘算法为多站点查询优化、Web 效用挖掘等的深入研究奠定了基础.实验表明,该算法相对于基线系统平均可以提高 16%的分类准确率,并减少了 34.5%的处理时间.展开更多
基金supported by grants from The National Natural Science Foundation of China(61170134,60775012)The Doctorate Foundation of Northwestern Polytechnical University(cx201017)~~
文摘动脉粥样硬化是因脂质堆积在血管壁上并受到多种遗传和环境因素影响的一种复杂的病理生理疾病。动脉粥样硬化风险疾病基因的辨识可以增进对该疾病机理的了解,并对该疾病的诊断和治疗起到指导性作用。虽然在风险疾病基因的辨识方面已经提出了很多计算方法,但仍存在着推论准确性和计算效率方面的问题。一种命名为基于熵聚类和双重筛选(Entropy-based clustering and double screening,ECDS)的新方法被用来辨识该疾病的风险疾病基因。该方法将功能基因组信息和蛋白质相互作用网络拓扑结构信息进行整合,运用于基于熵聚类的方法中,之后,使用双重筛选策略(即支持向量机和相似性得分)进行风险疾病基因挖掘。运用该方法,从巨噬细胞样本和泡沫细胞样本中分别辨识出79个和113个风险疾病基因。该结果表明ECDS在辨识动脉粥样硬化风险疾病基因方面非常有效。此外,该方法也很易于扩展应用到其它复杂疾病的风险基因辨识中。
文摘为了克服传统多目标演化算法在进化后期遗传操作可能失效使算法性能降低以及基于概率建模的多目标算法在演化初期由于种群分布尚未呈现一定规律,采样产生的新个体的搜索方向同目标方向存在差异,提出一种基于熵值的多目标演化算法(entropy based multi-objective evolutionary algorithm,EB-MOEA)。算法利用种群进化过程中,个体分布存在从无序到有序的现象,设计了一种基于熵值理论的种群分布计算方法,并将其作为种群从无序到有序过渡的判定准则,指导遗传操作和概率建模操作切换的时机。新算法采用ZDT、DTLZ系列测试集进行实验,通过与NSGA-Ⅱ以及RM-MEDA算法的实验对比,证明了新判断准则的有效性,EB-MOEA具有更好的寻优性能。
文摘随着Web 所拥有的信息量和信息种类的急剧增长,Web 站点挖掘对于自动实现特定主题的 Web 资源发现和分类具有重要的意义.然而现有的 Web 站点分类或挖掘算法在利用上下文语义信息、去除噪声信息以进一步提高分类准确率等方面还缺乏深入研究.从站点的采样尺寸、分析粒度和描述结构 3 个方面分析了设计高效的 Web 站点挖掘算法所需要解决的问题.在此基础上,提出了一种新的 Web 站点多粒度树描述模型,并描述了包括基于隐 Markov 树的两阶段分类算法、粒度间上下文融合算法、两阶段去噪程序以及基于熵的动态剪枝策略在内的多粒度 Web 站点挖掘算法.站点的多粒度描述方法及挖掘算法为多站点查询优化、Web 效用挖掘等的深入研究奠定了基础.实验表明,该算法相对于基线系统平均可以提高 16%的分类准确率,并减少了 34.5%的处理时间.