期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于基因关联分析的贝叶斯网络疾病样本分类算法
1
作者 李志杰 廖旭红 +1 位作者 李元香 李青蓝 《计算机应用》 CSCD 北大核心 2024年第11期3449-3458,共10页
基因表达数据作为生物学中一种特定类型的大数据,尽管基因表达值都是普通的实数值,但它们的相似性不是基于欧氏距离度量,而是基于基因表达值是否展现同升同降趋势。目前的基因贝叶斯网络以基因表达水平值为节点随机变量,没有体现这种子... 基因表达数据作为生物学中一种特定类型的大数据,尽管基因表达值都是普通的实数值,但它们的相似性不是基于欧氏距离度量,而是基于基因表达值是否展现同升同降趋势。目前的基因贝叶斯网络以基因表达水平值为节点随机变量,没有体现这种子空间模式的相似性。因此,提出基于基因关联分析的贝叶斯网络疾病分类算法(BCGA),从带类标签的疾病样本-基因表达数据中学习贝叶斯网络并预测新疾病样本的分类。首先,将疾病样本离散化过滤以选择基因,并将降维后的基因表达值排序和置换为基因列下标;其次,分解基因列下标序列为长度为2的原子序列集合,而这个集合的频繁原子序列对应一对基因的关联关系;最后,通过基因关联熵度量因果关系,并用于贝叶斯网络结构学习。BCGA的参数学习也变得很容易,基因节点的条件概率分布只要统计该基因的原子序列和父节点基因的原子序列出现频次即可。在多个肿瘤和非肿瘤基因表达数据集上的实验结果表明,相较于已有的同类算法,BCGA的疾病分类准确率明显提高,分析时间有效缩短;另外,BCGA使用基因关联熵代替条件独立性,使用基因原子序列代替基因表达值,可以更好地拟合基因表达数据。 展开更多
关键词 基因表达数据 频繁原子序列 基因关联熵 基因序列贝叶斯网络 疾病分类
下载PDF
一种基于最大频繁子图基因的模糊图神经网络检测模型
2
作者 周显春 肖衡 +1 位作者 焦萍萍 邹琴琴 《计算机时代》 2023年第9期14-18,共5页
针对恶意软件检测的准确性和时间效率问题,提出一种基于最大频繁子图基因的模糊图神经网络检测模型。首先利用SFFSM-SPIN-MGM方法挖掘恶意软件函数调用图的最大频繁子图,然后利用模糊图神经网络完成恶意软件同源性检测。实验结果表明,... 针对恶意软件检测的准确性和时间效率问题,提出一种基于最大频繁子图基因的模糊图神经网络检测模型。首先利用SFFSM-SPIN-MGM方法挖掘恶意软件函数调用图的最大频繁子图,然后利用模糊图神经网络完成恶意软件同源性检测。实验结果表明,该方法具有较强的泛化能力,能够有效地检测现有恶意软件的变种测试集,平均准确率92.1%,平均误报率4.3%、平均漏报率1.4%。 展开更多
关键词 恶意软件 动态函数调用图 最大频繁子图基因 模糊图神经网络
下载PDF
核因子NF-κB基因多态性与中国人2型糖尿病的相关研究 被引量:4
3
作者 邹伏英 邹大进 《中国医药导报》 CAS 2007年第06X期26-28,共3页
目的:探讨NF-κB的(CA)基因多态性与2型糖尿病(T2DM)及其大血管病变的相关性。方法:采用PCR-荧光法分析了161例2型糖尿病和99例正常健康对照组NF-κB的(CA)重复序列的多态性。结果:①A3(122 bp)、A9(134 bp)等位基因在两组中都比较常见;... 目的:探讨NF-κB的(CA)基因多态性与2型糖尿病(T2DM)及其大血管病变的相关性。方法:采用PCR-荧光法分析了161例2型糖尿病和99例正常健康对照组NF-κB的(CA)重复序列的多态性。结果:①A3(122 bp)、A9(134 bp)等位基因在两组中都比较常见;②A4(124 bp)等位基因的频率在CON组(20.20%)中明显高于T2DM组(2.48%)(χ2=45.935,P<0.0001);③A8等位基因频率在T2DM组(17.08%)中明显高于CON组(6.57%)(χ2=11.926,P<0.0001);④在T2DM组中,合并冠心病组和无冠心病组各等位基因频率无显著性差异。结论:NF-κB1基因在2型糖尿病的易感性上可能起到重要作用:等位基因A8的携带者比等位基因A4的携带者更容易患2型糖尿病。 展开更多
关键词 NF—κB 2型糖尿病 糖尿病大血管病变 多态性 微卫星 基因频率
下载PDF
双聚类的关联规则挖掘方法 被引量:4
4
作者 秦如新 田英杰 +2 位作者 陈静 邓乃扬 张海斌 《北京工业大学学报》 EI CAS CSCD 北大核心 2009年第4期561-565,共5页
为了使所有关联规则算法都可用于双聚类挖掘,将双聚类问题转化为关联规则的频繁集挖掘问题.在为双聚类挖掘提供大量算法的同时,不但能获得双聚类,而且还能得到额外的双聚类关联信息.基因表达数据的实验结果证明了其有效性.
关键词 双聚类 关联规则 频繁集 基因表达数据
下载PDF
四维飞行轨迹预测方法的研究 被引量:3
5
作者 王静 张建伟 梁海军 《计算机工程与设计》 CSCD 北大核心 2012年第4期1514-1517,1552,共5页
通过对空中交通运输管理中目前常用的轨迹预测算法的研究比较和分析,提出了利用遗传算法的从历史数据中进行函数挖掘的思想。针对四维轨迹数据特征的分析和传统的单一函数挖掘的局限性,提出了基于基因表达式编程的频繁函数集挖掘的建模... 通过对空中交通运输管理中目前常用的轨迹预测算法的研究比较和分析,提出了利用遗传算法的从历史数据中进行函数挖掘的思想。针对四维轨迹数据特征的分析和传统的单一函数挖掘的局限性,提出了基于基因表达式编程的频繁函数集挖掘的建模方法。该模型方法通过对历史飞行数据进行遗传算法的操作挖掘出数据集中对应的函数关系集合,用较好的函数模型预测未来航迹。以某一航班雷达数据为训练集做实验,结果表明了应用该方法的准确性和可用性。 展开更多
关键词 四维轨迹预测 空中交通管制 基因表达式编程 频繁函数集 函数挖掘
下载PDF
甘露糖结合凝集素基因多态性与儿童肾病综合征频复发的关联 被引量:2
6
作者 顾圆圆 夏正坤 +7 位作者 王艾丽 刘光陵 付元凤 熊华 高远赋 张连丰 伏洁 樊忠民 《医学研究生学报》 CAS 2006年第9期809-813,共5页
目的:探讨甘露糖结合凝集素(MBL)基因多态性与儿童肾病综合征(NS)频复发的关系。方法:对32例频复发肾病综合征(FRNS)、31例非频复发肾病综合征(NFRNS)患儿和32例健康儿童用序列特异性引物聚合酶链反应(PCR—SSP)法和聚合酶... 目的:探讨甘露糖结合凝集素(MBL)基因多态性与儿童肾病综合征(NS)频复发的关系。方法:对32例频复发肾病综合征(FRNS)、31例非频复发肾病综合征(NFRNS)患儿和32例健康儿童用序列特异性引物聚合酶链反应(PCR—SSP)法和聚合酶链反应限制性片段长度多态性(PCR—RFLP)法,分别检测MBL启动子和外显子1第54号密码子的基因多态性位点。结果:频复发组中复发前有上呼吸道感染史的患者54号密码子突变基因型(GGC/GAC型和GAC/GAC型)的发生频率(76.O%)显著高于非频复发组(42.9%);FRNS患儿54号密码子变异型等位基因B发生频率(34.4%)显著高于健康儿童(12.5%),频复发组变异型单倍型LYB的发生频率(34.4%)显著高于正常对照组(12.5%),频复发组与变异型单倍型LYB显著相关,OR=3.66,95%可信区间(CI)为1.49~9.01。结论:MBL基因突变是儿童NS频复发的原因之一,可为儿童NS复发的预防和治疗开辟一条蹊径。 展开更多
关键词 甘露糖结合凝集素 基因多态性 儿童 肾病综合征 频复发
下载PDF
基于基因表达式编程的频繁函数集挖掘 被引量:22
7
作者 贾晓斌 唐常杰 +3 位作者 左劼 陈安龙 段磊 汪锐 《计算机学报》 EI CSCD 北大核心 2005年第8期1247-1254,共8页
函数挖掘旨在从观测数据中发现有效的函数关系,传统的函数挖掘以发现单个函数为挖掘目标,难以处理复杂数据集.为解决上述问题,作者做了如下工作:(1)提出了描述能力更强的频繁函数集FFS概念;(2)提出并实现了基于基因表达式编程的频繁函... 函数挖掘旨在从观测数据中发现有效的函数关系,传统的函数挖掘以发现单个函数为挖掘目标,难以处理复杂数据集.为解决上述问题,作者做了如下工作:(1)提出了描述能力更强的频繁函数集FFS概念;(2)提出并实现了基于基因表达式编程的频繁函数集挖掘算法FFSM;(3)在GEP中采用了精度阈值队列策略PTQ,有效地提高了FFSM的成功率;(4)用实验证实了FFS更强的描述能力和PTQ的有效性,其中,在挖掘高精度复杂函数时PTQ使FFSM的成功率提高了55倍. 展开更多
关键词 频繁函数集 精度阈值队列 基因表达式编程 函数挖掘
下载PDF
基因表达数据的频繁闭合模式挖掘新算法 被引量:1
8
作者 缪裕青 陈国良 徐云 《中国科学技术大学学报》 CAS CSCD 北大核心 2007年第9期1080-1087,共8页
基因表达数据集与传统事务数据集相比呈现出新的特征,由于其项目数远远大于事务数,使得大量现有的基于项目枚举的频繁闭合模式挖掘算法不再适用.为此提出一种频繁闭合模式挖掘新算法TPclose,使用TP-树(tidset-prefix tree)保存项目的事... 基因表达数据集与传统事务数据集相比呈现出新的特征,由于其项目数远远大于事务数,使得大量现有的基于项目枚举的频繁闭合模式挖掘算法不再适用.为此提出一种频繁闭合模式挖掘新算法TPclose,使用TP-树(tidset-prefix tree)保存项目的事务集信息.该算法将频繁闭合模式挖掘问题转换成频繁闭合事务集挖掘问题,采取自顶向下分而治之的事务搜索策略,并组合了高效的修剪技术和有效的优化技术.实验表明,TPclose算法普遍快于自底向上事务搜索算法RERⅡ,最高达2个数量级以上. 展开更多
关键词 数据挖掘 关联规则 频繁闭合模式 基因表达数据 自顶向下
下载PDF
基于分段与运算的基因表达数据频繁项集挖掘 被引量:1
9
作者 王艳 骆嘉伟 +1 位作者 杨涛 吴君浩 《计算机工程与科学》 CSCD 2006年第11期70-72,84,共4页
本文在研究分析经典关联规则挖掘算法优缺点以及基因表达数据特点的基础上,提出了一种立足于基因表达数据的数据特点,不生成候选项集的基于分段与运算的基因表达数据频繁项集挖掘算法。实验证明该算法能更快速有效地挖掘出频繁项集。
关键词 基因表达数据 关联规则挖掘 与运算 频繁项集
下载PDF
重用最大频繁模式的可持续进化算法 被引量:1
10
作者 杨观赐 李琴 +1 位作者 李少波 钟勇 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第5期115-119,共5页
为了重用进化过程中沉淀在优秀个体集中的信息,设计了最大频繁序列模式挖掘算法,并在其基础上提出了重用最大频繁模式的可持续进化算法(MFPEA).该算法设置了多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁序列模... 为了重用进化过程中沉淀在优秀个体集中的信息,设计了最大频繁序列模式挖掘算法,并在其基础上提出了重用最大频繁模式的可持续进化算法(MFPEA).该算法设置了多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁序列模式挖掘算法挖掘种群中的优良基因,并将具有优良基因模块的新个体注入到不同适应度水平的种群中.文中还设计了针对不同问题动态调整进化种群规模的函数,通过一组统计数据研究了平衡计算时间与进化质量的相关参数.实验结果表明,MFPEA在维持遗传信息稳定性、避免早熟收敛方面表现良好,且获得了xit1083问题的新最优解记录(3611.496). 展开更多
关键词 最大频繁序列模式 序列挖掘 基因重用 可持续进化算法 旅行商问题
下载PDF
Rho A蛋白通路在DLC-1基因调控人结肠癌HT29细胞周期中的作用及其机制 被引量:10
11
作者 吴平平 苏昀 +3 位作者 金治 吴鹏 徐佳佳 黄培林 《东南大学学报(医学版)》 CAS 2009年第4期247-251,共5页
目的:探讨Rho A蛋白通路在DLC-1(frequently deleted in liver cancer-1)基因调控人结肠癌HT29细胞周期中的作用及其机制。方法:构建pcDNA3.1-DLC1质粒载体,脂质体法转染HT29细胞,筛选稳定细胞系;pull-down方法分析Rho A蛋白活性;实时定... 目的:探讨Rho A蛋白通路在DLC-1(frequently deleted in liver cancer-1)基因调控人结肠癌HT29细胞周期中的作用及其机制。方法:构建pcDNA3.1-DLC1质粒载体,脂质体法转染HT29细胞,筛选稳定细胞系;pull-down方法分析Rho A蛋白活性;实时定量PCR检测细胞周期相关蛋白Cyclin D1、p21的表达变化;流式细胞仪检测细胞周期分布。结果:野生型人结肠癌HT29细胞DLC-1基因表达呈阴性,经转染获得DLC-1稳定表达细胞系。与野生型及空载组HT29细胞相比,转染组细胞RhoA蛋白活性下降;Cyclin D1表达下调,p21表达上调;G1期及凋亡细胞数增加,而G2期细胞数下降。结论:转染DLC-1基因引起人结肠癌HT29细胞Rho A蛋白活性下调,进而可能通过对Cyclin D1、p21表达的调控使细胞周期G1期阻滞并诱导凋亡,同时分裂前期细胞数减少,细胞增殖受抑。 展开更多
关键词 肝癌缺失基因-1 RHO A蛋白 CYCLIN D1基因 P21基因 细胞周期 HT29细胞株
下载PDF
一种基于排序的基因表达数据频繁闭合模式挖掘算法
12
作者 寇晨艳 《电脑与信息技术》 2014年第3期7-10,共4页
频繁闭合模式是频繁模式的无损压缩,因此采用频繁闭合模式的挖掘来代替频繁模式挖掘,可以适当的压缩计算和存储开销。文中针对已有的面向基因表达数据集频繁闭合模式挖掘算法CARPENTER多次扫描数据集转置表带来巨大开销的缺陷,提出了基... 频繁闭合模式是频繁模式的无损压缩,因此采用频繁闭合模式的挖掘来代替频繁模式挖掘,可以适当的压缩计算和存储开销。文中针对已有的面向基因表达数据集频繁闭合模式挖掘算法CARPENTER多次扫描数据集转置表带来巨大开销的缺陷,提出了基于排序的频繁闭合模式挖掘算法SFCP。在真实数据集上的实验结果表明,该算法效率比CARPENTER算法高。 展开更多
关键词 基因表达数据 频繁闭合模式 排序
下载PDF
从基因芯片数据快速有效地挖掘共调控基因
13
作者 赵倩 尚学群 《计算机工程与应用》 CSCD 北大核心 2010年第9期33-37,共5页
针对基因芯片数据高噪音、列(基因)数比行(实验条件)数多几个数量级的特殊性,为了进一步提高从基因芯片数据挖掘共调控基因的时间效率和挖掘结果的有效性,首先根据所有两两基因对之间的Pearson相关系数对原始完整数据集进行分组,然后使... 针对基因芯片数据高噪音、列(基因)数比行(实验条件)数多几个数量级的特殊性,为了进一步提高从基因芯片数据挖掘共调控基因的时间效率和挖掘结果的有效性,首先根据所有两两基因对之间的Pearson相关系数对原始完整数据集进行分组,然后使用列(基因)枚举方法对各组数据分别进行闭合频繁模式挖掘,并对活化和抑制共调控关系的挖掘分别进行处理。实验结果证明:算法快速有效地挖掘出了两种共调控基因。 展开更多
关键词 基因芯片数据 共调控基因 Pearson相关系数 闭合频繁模式
下载PDF
基于音乐基因的乐谱存储模型 被引量:3
14
作者 特日根 李雄飞 《中国科学:信息科学》 CSCD 2014年第7期946-950,共5页
本文提出一种基于音乐基因的乐谱存储模型S-MusicXML.将乐谱的存储和处理的基本单位由音阶提升到基因,有利于通过数据挖掘技术对音乐内涵的挖掘和存储.定义了旋律基因等概念,并通过实验进一步分析了挖掘音乐基因比挖掘音乐频繁模式更有... 本文提出一种基于音乐基因的乐谱存储模型S-MusicXML.将乐谱的存储和处理的基本单位由音阶提升到基因,有利于通过数据挖掘技术对音乐内涵的挖掘和存储.定义了旋律基因等概念,并通过实验进一步分析了挖掘音乐基因比挖掘音乐频繁模式更有优势. 展开更多
关键词 音乐基因 数据挖掘 音乐内涵 旋律基因 频繁模式
原文传递
基因表达数据的频繁模式挖掘算法 被引量:1
15
作者 寇晨艳 郭红 《福州大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第2期194-198,共5页
使用关联规则的方法来挖掘基因表达数据,在研究分析经典关联规则挖掘算法优缺点的基础上,立足于基因表达数据所呈现的新特征,提出一种基于BSC_tree的分段与运算基因表达数据频繁模式挖掘新算法BSC-AND.实验结果表明,与FP-growth和FIS算... 使用关联规则的方法来挖掘基因表达数据,在研究分析经典关联规则挖掘算法优缺点的基础上,立足于基因表达数据所呈现的新特征,提出一种基于BSC_tree的分段与运算基因表达数据频繁模式挖掘新算法BSC-AND.实验结果表明,与FP-growth和FIS算法相比,所提出的算法具有更低的时间复杂性. 展开更多
关键词 基因表达数据 关联规则 频繁模式 挖掘算法
原文传递
基于序列挖掘的分等级搜索可持续进化算法 被引量:1
16
作者 杨观赐 李琴 +1 位作者 李少波 钟勇 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第7期40-44,共5页
讨论了最大频繁序列模式和公平竞争层次模型(HFC),设计了最大频繁序列模式的挖掘算法(MFSPMA),把MFSPMA同HFC结合起来,提出了基于序列挖掘技术的分等级搜索可持续进化算法(SEAHSM).该进化算法设置多个不同层次的种群为不同适应度水平的... 讨论了最大频繁序列模式和公平竞争层次模型(HFC),设计了最大频繁序列模式的挖掘算法(MFSPMA),把MFSPMA同HFC结合起来,提出了基于序列挖掘技术的分等级搜索可持续进化算法(SEAHSM).该进化算法设置多个不同层次的种群为不同适应度水平的个体提供生存空间,采用最大频繁子模式挖掘算法挖掘种群中的优良基因,并将具有优良基因模块的新个体注入到不同适应度水平的种群,从而实现遗传信息的稳定继承,有效避免优良基因的丢失.实验结果表明:SEAHSM在维持遗传信息稳定性、避免早熟收敛、提高搜索精度等方面表现良好. 展开更多
关键词 最大频繁序列模式 序列挖掘 遗传信息 基因重用 可持续进化算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部