期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
The application of hidden markov model in building genetic regulatory network
1
作者 Rui-Rui Ji Ding Liu Wen Zhang 《Journal of Biomedical Science and Engineering》 2010年第6期633-637,共5页
The research hotspot in post-genomic era is from sequence to function. Building genetic regulatory network (GRN) can help to understand the regulatory mechanism between genes and the function of organisms. Probabilist... The research hotspot in post-genomic era is from sequence to function. Building genetic regulatory network (GRN) can help to understand the regulatory mechanism between genes and the function of organisms. Probabilistic GRN has been paid more attention recently. This paper discusses the Hidden Markov Model (HMM) approach served as a tool to build GRN. Different genes with similar expression levels are considered as different states during training HMM. The probable regulatory genes of target genes can be found out through the resulting states transition matrix and the determinate regulatory functions can be predicted using nonlinear regression algorithm. The experiments on artificial and real-life datasets show the effectiveness of HMM in building GRN. 展开更多
关键词 geneTIC REGULATORY Network Hidden MARKOV model STATES TRANSITION gene Expression data
下载PDF
基于改进非线性自回归网络的洪水预测算法 被引量:3
2
作者 崔雅博 罗清元 刘丽娜 《沈阳工业大学学报》 CAS 北大核心 2023年第1期84-89,共6页
针对流域的洪水预测具有高度非线性和随机性的问题,提出了一种混合预测模型用于流域的洪水预测.该模型是一个集成了数据预处理模块的具有外部输入的非线性自回归神经网络,采用小波变换进行时间序列分解,利用多基因遗传编程进行细节缩放... 针对流域的洪水预测具有高度非线性和随机性的问题,提出了一种混合预测模型用于流域的洪水预测.该模型是一个集成了数据预处理模块的具有外部输入的非线性自回归神经网络,采用小波变换进行时间序列分解,利用多基因遗传编程进行细节缩放,以提高时域和频域特性的提取能力,进一步捕获时间序列的非平稳性,与NARX结合可以大幅提高洪水预测的准确性,利用栾川水文站15年中所测水文数据对所提模型进行验证和测试.实验结果表明,相比较于传统算法和其他预测算法,所提出的算法具有更高的预测准确度和性能,可广泛应用在洪水预测等领域. 展开更多
关键词 洪水预测 非线性自回归网络 混合预测模型 小波变换 多基因遗传编程 数据预处理 机器学习 神经网络
下载PDF
基于数据基因的P2P文件共享平台 被引量:2
3
作者 郭玉彬 奚建清 汤德佑 《计算机工程与应用》 CSCD 北大核心 2007年第18期161-164,共4页
定义了适用于P2P文件共享的数据基因模型,并给出了基于数据基因模型的P2P文件共享平台的体系结构。这一文件共享平台利用文件的数据基因组来组织和管理共享文件。由于同一文件的不同版本拥有不同的基因信息,它们可同时存在于系统中供用... 定义了适用于P2P文件共享的数据基因模型,并给出了基于数据基因模型的P2P文件共享平台的体系结构。这一文件共享平台利用文件的数据基因组来组织和管理共享文件。由于同一文件的不同版本拥有不同的基因信息,它们可同时存在于系统中供用户使用,因此数据一致性问题得到简化。由于可利用文件数据基因组中对相关文件的记录进行查询处理,系统查询实现更高效。文中还给出了此文件共享平台的数据查询算法与更新策略。 展开更多
关键词 数据基因 P2P文件共享 体系结构 数据查询 数据更新
下载PDF
多种lncRNA可影响黑色素瘤的发生和发展 被引量:4
4
作者 颜晗 谭丹 +2 位作者 谢攀 刘昭前 李曦 《中南大学学报(医学版)》 CAS CSCD 北大核心 2017年第2期134-138,共5页
目的:通过生物大数据挖掘,探讨长链非编码RNA(long noncoding RNA,lncRNA)与黑色素瘤发生发展的关系。方法:从基因表达综合数据库中的黑色素瘤m RNA表达谱数据集GSE15605中提取出一些lncRNA的表达信息,并分析这些lncRNA与黑色素瘤的关... 目的:通过生物大数据挖掘,探讨长链非编码RNA(long noncoding RNA,lncRNA)与黑色素瘤发生发展的关系。方法:从基因表达综合数据库中的黑色素瘤m RNA表达谱数据集GSE15605中提取出一些lncRNA的表达信息,并分析这些lncRNA与黑色素瘤的关联关系。结果:LINC01213,PGM5-AS1,LINC01133和LOC284578共4个lncRNA与黑色素瘤的发生和转移显著相关,其中LINC01213,LINC01133和LOC284578的表达可被BRAF基因突变影响,而PGM5-AS1的表达能被NRA S基因突变影响。利用这4个lncRNA的表达值构建的预测模型可较好地区分正常样本、初发黑色素瘤样本和转移性黑色素瘤样本。结论:Lnc RNA可能在黑色素瘤的发生和转移中起重要作用。 展开更多
关键词 黑色素瘤 长链非编码RNA 基因表达 数据提取 预测模型
下载PDF
基于朴素基因表达式编程的函数自动建模 被引量:7
5
作者 朱明放 唐常杰 +2 位作者 陈瑜 向勇 代术成 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2008年第4期126-131,共6页
为了进一步提高GEP的函数自动建模的效率,提出了朴素基因表达式编程模型(Na ve GEP)NGEP;提出了原子基因片断的概念,以保护进化良好的基因片段;引入了基因嫁接操作,实现了NGEP原型。实验表明:NGEP在函数自动建模的收敛速度是标准GEP的2~... 为了进一步提高GEP的函数自动建模的效率,提出了朴素基因表达式编程模型(Na ve GEP)NGEP;提出了原子基因片断的概念,以保护进化良好的基因片段;引入了基因嫁接操作,实现了NGEP原型。实验表明:NGEP在函数自动建模的收敛速度是标准GEP的2~4倍。 展开更多
关键词 基因表达式编程 二叉树数据结构 自动建模 原子基因串
下载PDF
基于单核苷酸多态性的基因互作分析方法学进展 被引量:5
6
作者 栾奕昭 左晓宇 +2 位作者 刘轲 李谷 饶绍奇 《遗传》 CAS CSCD 北大核心 2013年第12期1331-1339,共9页
基于单核苷酸多态性的关联分析已成为当前解析人类常见复杂疾病遗传机制的重要手段之一,然而,目前普遍使用的单位点分析策略仅能发现部分单独效应显著的易感SNP位点,因此遗漏了重要的遗传力组分——基因上位效应或联合效应。识别全基因... 基于单核苷酸多态性的关联分析已成为当前解析人类常见复杂疾病遗传机制的重要手段之一,然而,目前普遍使用的单位点分析策略仅能发现部分单独效应显著的易感SNP位点,因此遗漏了重要的遗传力组分——基因上位效应或联合效应。识别全基因组多基因间复杂的互作关系已成为全面解析复杂疾病致病分子机制必不可少的一项任务。已有很多方法被应用于全基因组交互作用分析,加深了人类对复杂疾病遗传机制的进一步认识。基于各类方法的理论基础及算法的异同,文章对目前应用较为广泛的基于遗传互作模型的方法、不基于互作模型的方法和数据挖掘类算法3类方法进行了系统地评述,着重介绍了这些方法的主要思想、实现过程及应用中的注意事项等,并指出开展大规模全基因组范围互作检测面临的问题,以期能为相关领域的研究者提供方法学参考。 展开更多
关键词 SNP 基因互作 模型依赖 数据挖掘算法 下游功能学分析
下载PDF
基于弹簧模型的基因表达数据可视化聚类 被引量:2
7
作者 颜文胜 《计算机工程》 CAS CSCD 北大核心 2011年第5期202-203,206,共3页
依据基因表达数据的特点,提出一种基于弹簧模型的基因表达数据可视化聚类方法,将多维空间的基因表达数据映射到二维空间中,较好地保持了原始多维数据间的时空相似性。实验结果表明,该方法能发现基因表达数据集中隐含的类簇结构以及共表... 依据基因表达数据的特点,提出一种基于弹簧模型的基因表达数据可视化聚类方法,将多维空间的基因表达数据映射到二维空间中,较好地保持了原始多维数据间的时空相似性。实验结果表明,该方法能发现基因表达数据集中隐含的类簇结构以及共表达基因模式。 展开更多
关键词 基因表达数据 可视化聚类 弹簧模型 共表达基因
下载PDF
基因表达谱芯片数据挖掘系统 被引量:2
8
作者 李荣 《计算机应用研究》 CSCD 北大核心 2009年第8期2938-2941,共4页
基因芯片是基因组研究的重要工具,其数据分析极大依赖于数据挖掘技术。结合数据挖掘技术和生物信息学研究,设计并实现了若干基因表达谱芯片数据挖掘分析模型及相应的数据挖掘系统,具有良好的收缩性和实体独立性,底层复杂的数据挖掘算法... 基因芯片是基因组研究的重要工具,其数据分析极大依赖于数据挖掘技术。结合数据挖掘技术和生物信息学研究,设计并实现了若干基因表达谱芯片数据挖掘分析模型及相应的数据挖掘系统,具有良好的收缩性和实体独立性,底层复杂的数据挖掘算法对用户透明。 展开更多
关键词 数据挖掘 生物信息学 基因芯片 基因表达 分析模型
下载PDF
基于GEP方法的数据流预测模型 被引量:2
9
作者 李国徽 付沛 +2 位作者 陈辉 赵海波 陈娜 《计算机工程》 CAS CSCD 北大核心 2007年第18期75-77,92,共4页
传统的预测建模方法有曲线拟合、线性回归分析等,这些方法通常只适用于求解结构简单的多项式函数。该文采用基因表达式程序设计方法,该算法简便、易于遗传操作,并且其搜索空间广阔,函数复杂度高,能广泛适用于各种类型的数据流预测。在... 传统的预测建模方法有曲线拟合、线性回归分析等,这些方法通常只适用于求解结构简单的多项式函数。该文采用基因表达式程序设计方法,该算法简便、易于遗传操作,并且其搜索空间广阔,函数复杂度高,能广泛适用于各种类型的数据流预测。在此基础上,提出当预测模型失效时的大变异策略,收到了很好的效果。 展开更多
关键词 数据流 预测查询 基因表达式程序设计 函数模型流 大变异策略
下载PDF
文件系统中对象血统的构造方法
10
作者 尹孟嘉 涂俊英 张涛 《孝感学院学报》 2008年第3期45-49,共5页
传统的安全模型忽略了主体、客体之间可能存在的关联,存在着一些安全漏洞。文章借鉴生物DNA的表达方式,定义了用户DNA、文件DNA的串结构,用DNA编码的简并性来表示主体、客体之间的亲疏关系,通过血统图或血统关系表来表达客体之间的关联... 传统的安全模型忽略了主体、客体之间可能存在的关联,存在着一些安全漏洞。文章借鉴生物DNA的表达方式,定义了用户DNA、文件DNA的串结构,用DNA编码的简并性来表示主体、客体之间的亲疏关系,通过血统图或血统关系表来表达客体之间的关联关系,通过DNA的匹配表示主体、客体之间的安全关联,从而将抽象的访问控制问题用结构化的算法过程描述出来并加以解决。 展开更多
关键词 安全模型 数据血统 文件血统 基因编码
下载PDF
基于癌症基因组图谱计划多组学数据构建胶质母细胞瘤六基因预后模型 被引量:3
11
作者 雷常贵 贾学渊 孙文靖 《遗传》 CAS CSCD 北大核心 2021年第7期665-679,I0002-I0011,共25页
胶质母细胞瘤(glioblastoma,GBM)是最常见的原发性颅内肿瘤,恶性程度极高,患者预后极差。为了识别GBM预后生物标记物,建立预后模型,本研究通过分析癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)数据库中GBM的表达谱数据,筛选出不... 胶质母细胞瘤(glioblastoma,GBM)是最常见的原发性颅内肿瘤,恶性程度极高,患者预后极差。为了识别GBM预后生物标记物,建立预后模型,本研究通过分析癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)数据库中GBM的表达谱数据,筛选出不同生存期GBM患者差异基因。利用GISTIC软件和Kaplan-Meier(KM)生存分析方法分析TCGA数据库中的GBM拷贝数变异数据,识别影响生存的扩增基因(survival-associated amplified gene,SAG)。取短生存期组上调基因和SAG两者的交集基因,进行单因素Cox回归和迭代Lasso回归筛选重要候选基因并建立预后模型;计算预后评分,根据预后评分中位数将患者分为高风险组和低风险组。用ROC曲线判断模型的优良,KM生存分析高低风险组预后差异,并用GEO、CGGA和Rembrandt数据库3个外部数据集进行验证。多因素Cox回归分析判断预后评分的预后独立性。结果显示,GBM不同生存期差异分析得到上调基因426个,下调基因65个。短生存期组上调基因与SAG交集得到47个基因。经过筛选,最终确定六基因(EN2、PPBP、LRRC61、SEL1L3、CPA4、DDIT4L)预后模型。TCGA实验组和3个外部验证组模型的ROC曲线下面积均大于0.6,甚至达到0.912。KM分析显示高低风险组的预后都存在差异(P<0.05)。在多因素Cox回归分析中,六基因预后评分是GBM患者预后的独立影响因素(P<0.05)。通过一系列分析,本研究确立了六基因(EN2、PPBP、LRRC61、SEL1L3、CPA4、DDIT4L)的GBM预后模型,模型具有很好的预测能力,可作为预测GBM患者的独立预后标志物。 展开更多
关键词 胶质母细胞瘤 多组学数据 六基因组合 预后模型 癌症基因组图谱计划
下载PDF
铁路行车事故加权马尔可夫SCGM(1,1)_c预测模型及应用 被引量:2
12
作者 李博 马云东 《安全与环境学报》 CAS CSCD 北大核心 2011年第4期144-148,共5页
从铁路行车事故的预测问题出发,试图找到稳定有效的方法对铁路行车事故进行预测。首先引入BX数据生成法对原始数据序列进行处理,以弱化原始数据之间的随机性。建立了单因子系统云灰色SCGM(1,1)。模型,揭示铁路行车事故时序变化的发展趋... 从铁路行车事故的预测问题出发,试图找到稳定有效的方法对铁路行车事故进行预测。首先引入BX数据生成法对原始数据序列进行处理,以弱化原始数据之间的随机性。建立了单因子系统云灰色SCGM(1,1)。模型,揭示铁路行车事故时序变化的发展趋势。参照原始数据的中心趋势曲线,来划分铁路行车事故状态,得到了状态转移概率矩阵。据此计算自相关系数并进行归一化,作为各步马尔可夫链的权重,提出了加权马尔可夫SCGM(1,1)。模型,以修正SCGM(1,1)。模型的预测值,对铁路行车事故总数进行了拟合和预测。结果表明:相比较而言,加权马尔可夫SCGM(1,1)。模型在对铁路行车事故的拟合和预测中均有较好的效果,拟合精度和预测精度分别达到了98.92%和96.36%。 展开更多
关键词 安全学 铁路行车 BX数据生成 SCGM(1 1)c 加权马尔可夫 事故预测
下载PDF
改进遗传算法在实体商业中精准营销研究与实现 被引量:6
13
作者 邹倩颖 王小芳 《现代电子技术》 北大核心 2018年第13期177-181,共5页
由于实体商业市场缺乏像电商平台那样的个性化交互平台,因此无法对客户进行精准营销,使得在商业市场上的竞争力越来越弱。为了解决这一问题,引入商家基因库模型,并记录客户在实体店铺中的历史购物行为、关注的产品类别等,结合最佳邻居... 由于实体商业市场缺乏像电商平台那样的个性化交互平台,因此无法对客户进行精准营销,使得在商业市场上的竞争力越来越弱。为了解决这一问题,引入商家基因库模型,并记录客户在实体店铺中的历史购物行为、关注的产品类别等,结合最佳邻居、效用函数等提出赋有权重的客户偏好模型。利用改进遗传算法对商家基因库模型与客户偏好模型进行匹配,以实现精准营销。研究以大数据为背景,利用Hadoop集群的Map Reduce编程实现改进遗传算法,用以在n维商家空间中快速、精准地找出最符合客户需求的商家。实验结果表明,改进遗传算法相对于传统遗传算法在推荐准确率上平均提升15.6%,在推荐响应时间上提升41.9%。 展开更多
关键词 改进遗传算法 精准营销 商家基因库 客户偏好模型 范围相似度函数 大数据
下载PDF
分子结构与基因序列数据综合可视化方法研究
14
作者 邹辰 宋成龙 +1 位作者 王文珂 李思昆 《计算机技术与发展》 2014年第6期1-5,9,共6页
随着系统生物学的兴起和迅速发展,为了探索不同生物层次信息之间的关联关系,对不同层次生物科学计算数据综合可视化的需求日益迫切。不同层次的生物数据的组织管理是实现综合可视化的基础和关键技术,因此文中面向生物信息可视化领域的需... 随着系统生物学的兴起和迅速发展,为了探索不同生物层次信息之间的关联关系,对不同层次生物科学计算数据综合可视化的需求日益迫切。不同层次的生物数据的组织管理是实现综合可视化的基础和关键技术,因此文中面向生物信息可视化领域的需求,基于综合可视化集成框架,提出了一种分子结构与基因序列数据的元数据组织模型与关联数据自动生成方法。该方法通过定义包括分子结构、基因序列以及分子结构/基因序列关联信息三类数据的元数据模型,建立了该两个层次和领域数据的关联关系,确定了关联数据描述格式;利用先进的XML技术实现了分子领域和基因序列领域元数据的自动提取和转换。在此基础之上开发了一个分子结构数据与基因序列数据综合可视化原型系统,取得了良好的试用效果。 展开更多
关键词 分子结构可视化 基因序列可视化 综合可视化 元数据 数据模型 可扩展标记语言 数据转换
下载PDF
基于基因表达小样本数据的级联森林分类模型 被引量:4
15
作者 范怡敏 齐林 帖云 《计算机应用与软件》 北大核心 2020年第11期165-171,共7页
针对分类模型在处理基因表达小样本高维度数据集上存在的分类准确性不足、过拟合、计算复杂度大等问题,提出一种改进模型Two Boosting Deep Forest(TBDForest)。在多描部分采用均等式特征利用方法对原始特征进行变换;在分类过程中考虑... 针对分类模型在处理基因表达小样本高维度数据集上存在的分类准确性不足、过拟合、计算复杂度大等问题,提出一种改进模型Two Boosting Deep Forest(TBDForest)。在多描部分采用均等式特征利用方法对原始特征进行变换;在分类过程中考虑到模型所集成的每个森林的拟合质量,将上层最重要的部分判别特征输入到下一级联层,在层间改善类分布问题;对原级联层采用子层级联的结构,增加样本训练机会,减少训练开销,避免模型对参数的依赖。通过在五种疾病基因表达小样本数据集上的验证结果表明,改进的模型增强分类算法在小样本数据集的分类性能上达到了更好的分类效果。 展开更多
关键词 基因表达数据 深度森林 小样本 分类模型
下载PDF
基于XGBoost的基因静态数据调控网络推断方法
16
作者 车丹丹 郭顺 姜青山 《集成技术》 2020年第2期50-59,共10页
对于静态基因表达数据来说,推断基因调控网络仍是系统生物学中的一个挑战——存在大量识别难度高的直接或间接调控关系,而传统方法的准确性和可靠性还有待进一步提高。为此,该文提出一种基于Boosting集成模型的方法(XGBoost),应用随机... 对于静态基因表达数据来说,推断基因调控网络仍是系统生物学中的一个挑战——存在大量识别难度高的直接或间接调控关系,而传统方法的准确性和可靠性还有待进一步提高。为此,该文提出一种基于Boosting集成模型的方法(XGBoost),应用随机化和正则化来解决模型过拟合问题,同时针对建模所得权重不一致的问题,对初始权重增加归一化和统计学方法处理。最终,采用DREAM5挑战的基准数据集对所提出方法进行性能验证。实验结果表明,XGBoost比现有其他方法获得更好的性能:在in-silico生成的模拟数据集中,接受者操作特征曲线面积(AUPR)和正确率-召回率曲线面积(AUROC)两个评估指标均显著优于现有方法;在E.coli和S.cerevisiae两种生物的真实实验数据中,AUROC指标均高于现有最优方法。 展开更多
关键词 基因调控网络 静态数据 Boosting模型 基因表达数据
下载PDF
基因表达时序数据的HMM层次聚类 被引量:1
17
作者 赵国庆 邓伟 《计算机工程与应用》 CSCD 北大核心 2011年第32期167-169,共3页
DNA微阵列技术的应用产生了大量的基因表达时序数据,对这些数据进行聚类是获取其中隐含的生物分子信息的一种重要方法。提出了一种基于隐马尔可夫模型(HMM)的层次聚类方法,根据基因表达时序数据的统计特性对其进行标准化和离散化等预处... DNA微阵列技术的应用产生了大量的基因表达时序数据,对这些数据进行聚类是获取其中隐含的生物分子信息的一种重要方法。提出了一种基于隐马尔可夫模型(HMM)的层次聚类方法,根据基因表达时序数据的统计特性对其进行标准化和离散化等预处理,用HMM对经过预处理的数据建模以利用基因表达时序数据不同时间点之间的相关性,用层次聚类方法对建立的模型进行聚类。实验结果表明该方法不仅能够产生好的聚类,而且能够确定最优的聚类数。 展开更多
关键词 基因表达时序数据 统计特性 隐马尔可夫模型 层次聚类
下载PDF
基于数据集成的基因调控网络构建 被引量:1
18
作者 李晓华 邓伟 《计算机工程》 CAS CSCD 2012年第22期263-266,共4页
原有数据集成方法在基因调控网络构建中不能很好地利用数据之间的相关特性。为此,提出一种改进的数据集成方法。分别利用敲除数据和微扰数据进行预测,根据2种实验数据预测结果的重叠程度赋予不同的可信度,优先考虑重叠程度高的部分,按... 原有数据集成方法在基因调控网络构建中不能很好地利用数据之间的相关特性。为此,提出一种改进的数据集成方法。分别利用敲除数据和微扰数据进行预测,根据2种实验数据预测结果的重叠程度赋予不同的可信度,优先考虑重叠程度高的部分,按照可信度对预测结果进行排序。采用Dream3数据集与原有方法进行性能对比,实验结果表明,改进方法的总体性能比原有方法高出4.9%。 展开更多
关键词 基因调控 数据集成 敲除数据 微扰数据 噪声模型 微分方程
下载PDF
GEP在实际生活中的应用研究
19
作者 刘昆 黄樟灿 《科技情报开发与经济》 2010年第21期137-139,共3页
在实际生活中,需要对大量的离散数据建立数学模型对其进行分析和处理,并通过模型对此问题的结果进行预测。介绍了GEP的基本结构和过程,阐述了GEP在实际中的应用。
关键词 离散数据 基因表达式程序设计 函数建模
下载PDF
基于GD-GEP算法的航空发动机振动监控
20
作者 单兵 倪世宏 +1 位作者 谢川 孙逢啸 《计算机测量与控制》 北大核心 2014年第5期1450-1452,1463,共4页
针对传统基因表达式编程算法(GEP)在进行函数挖掘时易陷入局部最优以及收敛精度不高等问题,提出了一种基于基因多样性的GEP算法,该算法采用基于基因多样性的初始种群生成策略,引入了种群更新策略,使得种群基因多样性增加;仿真试验表明,... 针对传统基因表达式编程算法(GEP)在进行函数挖掘时易陷入局部最优以及收敛精度不高等问题,提出了一种基于基因多样性的GEP算法,该算法采用基于基因多样性的初始种群生成策略,引入了种群更新策略,使得种群基因多样性增加;仿真试验表明,该算法具有更好的全局搜索能力和更高的解精度;基于某型飞机飞行数据记录器记录的飞行数据,利用GD-GEP算法进行航空发动机模型辨识,将辨识得到的模型用于发动机振动值监控,真实的振动故障数据验证了该方法能够成功监测到振动故障。 展开更多
关键词 基因表达式编程 飞行数据 航空发动机 模型辨识 振动值监控
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部