期刊文献+
共找到101篇文章
< 1 2 6 >
每页显示 20 50 100
基于单细胞多组学数据解析结直肠癌动态调控扰动 被引量:1
1
作者 徐琪 禹雷 +2 位作者 潘涛 张娅 李永生 《海南医学》 CAS 2024年第11期1533-1544,共12页
目的探讨结直肠癌恶性转变过程中的分子特征及其调控网络扰动,深入剖析结直肠癌恶性转变的微环境异质性并识别潜在治疗靶点。方法首先从Gene Expression Omnibus(GEO)数据库中收集单细胞转录组测序数据,从欧洲分子生物学实验室(EMBL)收... 目的探讨结直肠癌恶性转变过程中的分子特征及其调控网络扰动,深入剖析结直肠癌恶性转变的微环境异质性并识别潜在治疗靶点。方法首先从Gene Expression Omnibus(GEO)数据库中收集单细胞转录组测序数据,从欧洲分子生物学实验室(EMBL)收集单细胞ATAC测序数据。数据共涉及来自14例患者的70例样本,包含22例正常样本、43例息肉样本和5例肿瘤样本。首先对scRNA-Seq测序数据进行预处理,基于Seurat包筛除双细胞和低质量细胞,对scATAC-Seq测序数据使用10X Cell Ranger-atac进行原始数据处理,并使用Signac包去除低质量细胞,得到三个阶段的scRNA-Seq和scATAC-Seq细胞图谱。进一步数据整合,基于Pando R包推断T细胞和上皮细胞的转录调控网络,通过mfinder软件分析网络motif和拓扑属性,对转录因子进行分级分析。最后,基于随机森林算法进行细胞分子特征预测及预后分析。结果筛选出202465个scRNA-Seq测序细胞和136422个scATAC-Seq测序细胞。基于数据整合分析,构建不同癌变阶段的细胞图谱。结果发现,随着结直肠癌进展,肿瘤微环境组成发生显著变化,尤其是T细胞和上皮细胞在不同疾病阶段的比例有较大差异。基于单细胞多组学数据整合,利用Pando包推断结直肠癌不同阶段的转录调控网络,揭示了T细胞和上皮细胞中转录因子及其调控关系的动态变化。功能富集分析结果显示在T细胞和上皮细胞中,转录因子所调控的功能在不同的疾病阶段有明显差异。基于转录调控网络分析发现,T细胞和上皮细胞转录调控网络符合无标度网络特性。网络motif分析揭示了在不同阶段存在的特定motif模式,反映了网络拓扑结构的动态变化,且网络中大多数相互作用都具有阶段特异性。共享转录因子的层级在癌变过程中也会发生变化。最后基于转录因子调控网络构建的分类器可以成功识别T细胞和上皮细胞,表明其作为细胞分子特征的有效性。进一步识别出与患者生存显著相关的网络motif,揭示其在结直肠癌预后中的潜在作用。结论基于整合单细胞多组学数据构建转录调控网络,解析随结直肠癌的进展转录调控网络及其功能的动态变化,揭示了结直肠癌进展过程中的细胞分子特征及关键预后motif,为结直肠癌的分子机制及预后评估提供了深刻见解。 展开更多
关键词 结直肠癌 单细胞多组学数据 转录调控网络 细胞分子特征
下载PDF
网络增强核融合方法的改进及其在乳头状肾细胞癌多组学数据整合分子分型中的应用
2
作者 师国京 李灵梅 +6 位作者 魏亿芳 赵鑫 房瑞玲 杨海涛 余红梅 张岩波 曹红艳 《中国卫生统计》 CSCD 北大核心 2024年第3期376-381,共6页
目的针对网络增强的相似网络融合(network enhancement fusion,ne-SNF)方法先融合不同组学网络,再对融合后的网络降噪,忽略了不同组学相似网络噪声对融合网络影响的问题,本文提出了改进的网络增强融合(improved network enhancement fus... 目的针对网络增强的相似网络融合(network enhancement fusion,ne-SNF)方法先融合不同组学网络,再对融合后的网络降噪,忽略了不同组学相似网络噪声对融合网络影响的问题,本文提出了改进的网络增强融合(improved network enhancement fusion,improved ne-SNF)方法,并探讨其在乳头状肾细胞癌(papillary renal cell carcinoma,PRCC)分子分型中的应用,识别PRCC高危患者,筛选重要通路及免疫浸润细胞。方法通过模拟研究评估improved ne-SNF分型性能,并将其用于PRCC多组学数据的整合分型,利用Cox回归模型分析不同分型患者的预后风险;筛选不同分型的差异表达mRNA(DEmRNAs)、miRNA(DEmiRNAs)及差异甲基化基因(DMGs),并对其重合基因进行KEGG通路分析;最后对不同分型患者进行免疫细胞浸润分析。结果模拟研究结果表明improved ne-SNF在不同信号比例和噪声强度下的分型准确性均优于SNF和ne-SNF。improved ne-SNF方法将PRCC患者分为高危组和低危组,高危组患者的死亡风险是低危组的7.727倍;筛选出3511个DEmRNAs,96个DEmiRNAs及3426个DMGs,其联合分析的649个重合基因得到42条有统计学差异的KEGG通路。此外,筛选出3种在不同分型中存在统计学差异的免疫浸润细胞。结论improved ne-SNF分型性能优于SNF和ne-SNF,且能够有效识别PRCC预后高风险患者,并筛选出PRCC重要通路及相关免疫浸润细胞,为PRCC的治疗及预后提供新的思路和参考依据。 展开更多
关键词 改进的网络增强融合 乳头状肾细胞癌 组学数据整合 分子亚型
下载PDF
多组学数据驱动的机器学习模型在乳腺癌生存及治疗响应预测中的应用 被引量:1
3
作者 章子怡 王棨临 +4 位作者 张俊有 段迎迎 刘家欣 刘赵硕 李春燕 《遗传》 CAS CSCD 北大核心 2024年第10期820-832,共13页
乳腺癌的高度异质性导致其治疗及预后评估较为复杂。治疗方案的选择受到肿瘤亚型、病变分级、基因型等多种因素的影响,因此需要制定个体化治疗策略。患者的预后效果因病情不同而产生显著差异。作为人工智能的一个重要分支,机器学习能高... 乳腺癌的高度异质性导致其治疗及预后评估较为复杂。治疗方案的选择受到肿瘤亚型、病变分级、基因型等多种因素的影响,因此需要制定个体化治疗策略。患者的预后效果因病情不同而产生显著差异。作为人工智能的一个重要分支,机器学习能高效处理海量数据,并实现决策过程的自动化。机器学习方法的引入将为乳腺癌治疗的选择和预后评估提供新的解决方案。在癌症治疗领域,传统方法预测生存与治疗效果往往依赖于单一或少量的生物标志物,难以全面捕捉复杂的生物学过程。机器学习通过分析患者的多组学数据以及它们在疾病发生发展过程中复杂的变化趋势,预测患者的生存和治疗响应效果,从而选择适合的治疗措施,实施早期干预,改善患者的治疗效果。本文首先介绍了常用的机器学习方法,在此基础上分别从评估生存情况和预测治疗效果这两方面展开,详细分析了机器学习在乳腺癌患者生存预测及预后领域中的应用,以期为乳腺癌患者提供精准医疗治疗策略,提高治疗效果和生存质量。 展开更多
关键词 乳腺癌 机器 组学数据整合分析 生存预测 治疗响应
下载PDF
基于多维组学数据的玉米农艺和品质性状预测研究
4
作者 杨静蕾 吴冰杰 +1 位作者 王安洲 肖英杰 《作物学报》 CAS CSCD 北大核心 2024年第2期373-382,共10页
基因组选择是利用覆盖基因组的高密度标记对未知表型进行预测并选择的技术。在植物中,利用该技术可对不同作物性状进行早期选择,保留优势个体,节约田间管理和表型鉴定成本,大大加快育种进程。本研究使用rrBLUP和LASSO两种统计模型,基于... 基因组选择是利用覆盖基因组的高密度标记对未知表型进行预测并选择的技术。在植物中,利用该技术可对不同作物性状进行早期选择,保留优势个体,节约田间管理和表型鉴定成本,大大加快育种进程。本研究使用rrBLUP和LASSO两种统计模型,基于基因组、转录组和代谢组数据对玉米的农艺性状和品质性状进行了基因组预测。研究发现,对于不同组学数据而言,其预测能力高低依次为基因组、转录组、代谢组数据。对于不同性状而言,品质性状的预测能力高于农艺性状。对于rrBLUP和LASSO两种模型而言,基于基因组数据预测时所有性状均是rrBLUP为最优预测模型;基于转录组数据预测时有53种性状是以rrBLUP为最佳预测模型, 2种性状以LASSO为最佳预测模型;基于代谢组数据,有43种性状以rrBLUP为最佳预测模型, 12种性状以LASSO为最佳预测模型。此外,还发现用不同系谱材料进行预测时,热带玉米预测温带玉米,其效果略优于温带玉米预测热带玉米。而对于品质性状,不同系谱间材料的预测精度高于同一系谱内。本研究系统评估了各种组学数据和不同统计模型对玉米农艺及品质性状预测能力的差异,为未来玉米重要性状的基因组育种提供了理论依据。 展开更多
关键词 玉米 农艺和品质性状 基因预测 多维组学数据
下载PDF
基于组学数据的生物学模块识别方法研究进展
5
作者 刘芝霖 荣志炜 +3 位作者 黄吉科 宋佳丽 俞轶培 侯艳 《中国卫生统计》 CSCD 北大核心 2024年第4期635-640,共6页
组学数据在分子层面上加深了研究者对表型相似疾病的辨别能力及对认识不足疾病的理解,对组学数据的分析能够在疾病的诊断与治疗中发挥至关重要的作用。组学分子间存在复杂的调控关系,过去的研究表明细胞的功能是模块化的^([1]),在疾病... 组学数据在分子层面上加深了研究者对表型相似疾病的辨别能力及对认识不足疾病的理解,对组学数据的分析能够在疾病的诊断与治疗中发挥至关重要的作用。组学分子间存在复杂的调控关系,过去的研究表明细胞的功能是模块化的^([1]),在疾病的实际进展中,关键的调控网络出现异常往往表现为网络中所有分子表达水平都发生变化^([2]),因此表达模式相似的分子很可能存在共调控或功能相关的情况^([3])。 展开更多
关键词 辨别能力 组学数据 调控网络 表达模式 分子层面 模块化 调控关系 生物
下载PDF
冠状病毒感染动物模型组学数据集成分析
6
作者 吴玥 李璐 +5 位作者 张阳 王珏 冯婷婷 李依桐 王凯 孔琪 《实验动物与比较医学》 CAS 2024年第4期357-373,共17页
目的分析各个公共数据库中可感染人的冠状病毒感染动物模型的组学数据资源情况,包括数据分布、数据集数量、数据类型、物种、品系、研究内容等,从而深入理解冠状病毒的生物学特征和致病机制,为研究有效的治疗方案和预防措施奠定基础。... 目的分析各个公共数据库中可感染人的冠状病毒感染动物模型的组学数据资源情况,包括数据分布、数据集数量、数据类型、物种、品系、研究内容等,从而深入理解冠状病毒的生物学特征和致病机制,为研究有效的治疗方案和预防措施奠定基础。方法定义特定病毒名称、时间范围和物种等检索策略与纳入排除标准,检索GEO、ArrayExpress等大型公共组学数据库。根据不同字段类型进行二次过滤,获取更精确的数据列表。建立组学数据文本库,进行文献计量学分析,构建共现网络图,分析不同研究主题、技术方法和涉及物种之间的关联强度。同时,分析研究涉及的细胞类型、器官和参与的生物途径,以进一步阐明病原体与宿主之间的致病相互作用。结果含有冠状病毒组学数据的公共数据库有20余个,以新型冠状病毒感染组学数据为主。常用物种为人、小鼠、仓鼠和猴,常用病毒株为Wuhan-Hu-1和USA-WA1/2020。此外,人类相关研究主要集中于气道上皮细胞和Calu-3细胞,动物模型(如小鼠、猕猴与雪貂)则多采用肺组织。表达谱数据显示感染后参与炎症、细胞因子反应、补体途径、细胞损伤、增殖和分化等通路基因显著上调。蛋白组学研究揭示,在不同感染阶段的患者样本中磷酸化蛋白质组、泛素组和全蛋白质组具有显著变化。特定蛋白质类别,包括病毒受体和蛋白酶、转录因子、细胞因子、凝血系统相关蛋白、血管生成相关蛋白及纤维化标志物等六类蛋白均在冠状病毒感染后发生改变。此外,代谢组数据提示磷酸胆碱、磷酸乙醇胺、花生四烯酸和油酸可作为潜在的代谢标志物。表观组学研究结果显示,m6A甲基化在新冠病毒复制、感染和传播过程中发挥作用,并且对宿主细胞-病毒互作产生影响。N、S、非结构蛋白2和3泛素化最为显著。微生物组学研究趋势表明,肠道和废水中的微生物群落正在成为新的研究重点。结论冠状病毒组学数据类型丰富,模型与细胞类型多样。根据不同病毒的特征,造模物种和技术方法的选择具有差异性。研究冠状病毒感染动物模型的多组学数据可以揭示宿主-病原体之间的关键相互作用,发现生物标志物和潜在的治疗靶点,为深入理解冠状病毒的生物学特性和感染机制提供丰富信息。 展开更多
关键词 冠状病毒感染 动物模型 组学数据 SARS-CoV-2 SARS-COV MERS-CoV 集成分析
下载PDF
基于多头自编码网络的单细胞多组学数据无监督降噪
7
作者 李双翼 刘发荣 +1 位作者 任胜 于彬 《青岛科技大学学报(自然科学版)》 CAS 2024年第4期146-158,共13页
单细胞多组学测序正在广泛应用于生物医学研究中,并产生大量的多样性组学数据。然而原始的单细胞多组学数据包含多种类型的测序噪声和冗余信息,对后续生物医疗层面的分析造成困难。现有的降噪方法主要依赖于单一的数据分布假设,并针对... 单细胞多组学测序正在广泛应用于生物医学研究中,并产生大量的多样性组学数据。然而原始的单细胞多组学数据包含多种类型的测序噪声和冗余信息,对后续生物医疗层面的分析造成困难。现有的降噪方法主要依赖于单一的数据分布假设,并针对性的处理单个组学数据,这对模型联合处理不同组学数据造成极大地限制。本研究提出一种使用单细胞多组学数据降噪的分析方法,称为scMAED(single-cell multi-omics data via a multi-head autoencoder network to denoising)。模型在多头自动编码器网络中添加了分类解码器,以无监督的方式来最大程度的去除数据噪声。首先,使用两个编码器独立学习多组学数据的内部特征,并联合输出的低维特征进行共同解码。其次,分类解码器不做任何数据分布假设,通过使用预测的细胞簇标签来反馈数据信息,以最大限度的去除复杂噪声。最后,使用主成分分析和t-SNE进行可视化。本文基于模拟数据集和真实的小鼠数据集对模型进行性能评估,结果显示sc-MAED在降噪效果上优于实验中的对比方法,并能够极大的改善单细胞多组学数据的质量。 展开更多
关键词 单细胞多组学数据 深度 多头自编码网络 降噪
下载PDF
基于深度多视图对比学习方法的多组学数据整合及预后预测模型构建
8
作者 高新凤 《应用数学进展》 2024年第9期4182-4190,共9页
在癌症研究中,精准识别癌症亚型和评估患者预后对制定优化治疗方案至关重要。高通量测序技术生成的大量多组学数据为癌症预后研究提供了宝贵资源。深度学习方法能够有效整合这些数据,精确识别更多癌症亚型。在本研究中,我们分析了12种... 在癌症研究中,精准识别癌症亚型和评估患者预后对制定优化治疗方案至关重要。高通量测序技术生成的大量多组学数据为癌症预后研究提供了宝贵资源。深度学习方法能够有效整合这些数据,精确识别更多癌症亚型。在本研究中,我们分析了12种癌症的多组学数据集,并将其作为模型的输入。我们提出了一种基于卷积自动编码器的深度多视图对比学习模型(dmCLCAE),该模型旨在利用多组学数据预测与生存相关的癌症亚型。为了验证模型的效果,我们对比了多组学因子分析算法(MOFA+)和深度学习模型(ProgCAE)在不同癌症类型分类中的表现。结果显示,dmCLCAE在区分不同生存亚型方面表现出显著优势,同时在预测一致性上也有更优异的表现。In cancer research, accurately identifying cancer subtypes and assessing patient prognosis are crucial for developing optimized treatment strategies. The vast amount of multi-omics data generated by high-throughput sequencing technologies provides valuable resources for cancer prognosis studies. Deep learning methods can effectively integrate these data to accurately identify more cancer subtypes. In this study, we analyzed multi-omics datasets from 12 types of cancer and used them as input for our model. We proposed a deep multi-view contrastive learning model based on a convolutional autoencoder (dmCLCAE), designed to predict survival-related cancer subtypes using multi-omics data. To validate the model’s performance, we compared it with the Multi-Omics Factor Analysis v2 (MOFA+) and prognostic model based on a convolutional autoencoder (ProgCAE) in classifying various cancer types. The results showed that dmCLCAE demonstrated a significant advantage in distinguishing different survival subtypes and exhibited superior consistency in predictions. 展开更多
关键词 组学数据 卷积自编码器 对比 深度
下载PDF
具有局部和全局注意力机制的图注意力网络学习单样本组学数据表征 被引量:1
9
作者 周丰丰 张金楷 《吉林大学学报(理学版)》 CAS 北大核心 2023年第6期1351-1357,共7页
针对生物组学数据中基因数目远大于样本数目的高维“大p小n”问题,提出一种具有局部和全局注意力机制的图注意力网络GATOr.该模型首先在组学数据上利用Pearson相关系数计算特征之间的相关性,构建组学数据的单样本网络;然后提出一种结合... 针对生物组学数据中基因数目远大于样本数目的高维“大p小n”问题,提出一种具有局部和全局注意力机制的图注意力网络GATOr.该模型首先在组学数据上利用Pearson相关系数计算特征之间的相关性,构建组学数据的单样本网络;然后提出一种结合局部和全局注意力机制的图注意力网络从单样本网络中学习基于图的组学特征表示,从而将组学数据的高维特性转化为低维表示.实验结果表明,GATOr与其他传统分类算法相比,在分类任务的准确率及其他指标上均取得了较优性能. 展开更多
关键词 组学数据 单样本网络 注意力机制 图注意力网络
下载PDF
自适应性FDR控制程序原理及组学数据应用
10
作者 王子兴 薛芳 姜晶梅 《中国卫生统计》 CSCD 北大核心 2023年第1期68-73,共6页
目的高维组学数据分析常伴随多重检验问题,不当处理可造成检验效能低下或阳性发现错误率(FDR)升高。FDR已发展为一类新的控制标准,衍生出一系列理论和方法。方法本研究首先对一类自适应性FDR控制方法原理及条件进行介绍,其基于Benjamini... 目的高维组学数据分析常伴随多重检验问题,不当处理可造成检验效能低下或阳性发现错误率(FDR)升高。FDR已发展为一类新的控制标准,衍生出一系列理论和方法。方法本研究首先对一类自适应性FDR控制方法原理及条件进行介绍,其基于Benjamini-Hochberg程序,由数据自适应性地估计真实原假设数(m 0)进而对FDR实现控制;具体方法包括迭代式、分位数(中位数、定值)、多阶段、阈值函数调整、m 0外插等。进一步,将上述方法用于肺癌患者CT图像特征和COVID-19患者血清蛋白表达两个实例分析。结果相对两项分析中的控制前结果,各自适应性FDR控制方法均降低了阳性发现数,并相比Bonferroni校正结果很大程度保留了阳性比例。然而蛋白表达实例提示,该类程序无法从根本上解决结果不稳定性问题。通过数据拆分验证,适当降低拟控制水平并以各方法的结果进行综合评估,可使筛选结果稳定性得到一定程度提升。结论由于自适应性FDR控制程序基于样本估计m 0且需满足特定结构假设,高维小样本组学数据的结构复杂性可对其分析效果产生影响,故建议进行方法间的联合应用和综合评价。在阳性发现比例较大时,经典的线性递增程序不失为一种简易、稳健且有效的FDR控制方法。 展开更多
关键词 阳性发现错误率 多重检验 组学数据 自适应性控制程序
下载PDF
基于多组学数据和稀疏变分自编码器的生存分析算法 被引量:1
11
作者 殷清燕 武锐萍 +1 位作者 陈旺旺 边根庆 《计算机应用研究》 CSCD 北大核心 2023年第3期771-775,共5页
针对生存分析中多组学数据带来的维数灾难和过拟合问题,提出了一种基于多组学数据和稀疏变分自编码器的生存分析算法VAESCox。该算法将变分自编码器的基本结构与稀疏编码和生存分析相结合,在无监督阶段训练变分自编码器学习低维表示,在... 针对生存分析中多组学数据带来的维数灾难和过拟合问题,提出了一种基于多组学数据和稀疏变分自编码器的生存分析算法VAESCox。该算法将变分自编码器的基本结构与稀疏编码和生存分析相结合,在无监督阶段训练变分自编码器学习低维表示,在监督阶段将训练的权重迁移到生存分析模型,并对传递权重进行微调和稀疏编码。实验结果表明,在八种不同癌症类型的数据集上,VAESCox模型在消融和对比实验中均取得了较高的C指数值。与其他四种基准生存分析方法相比,所提算法不仅缓解了多组学数据融合的过拟合问题,也显著提高了生存预测性能,表明不同组学数据的融合有助于预后生存结果的精准预测。 展开更多
关键词 生存分析 组学数据融合 变分自编码器 稀疏编码
下载PDF
KIRC组学数据分类的自注意亚型识别神经网络
12
作者 李阳 陈锡程 伍亚舟 《计算机工程与应用》 CSCD 北大核心 2023年第23期104-113,共10页
为分析肾透明细胞癌(KIRC)的转录组学数据,利用自注意力机制构建改良分类模型。构建了一种新的自注意力亚型识别神经网络(SSRNN),其包含了编码器和分类器部分,以自注意力机制为主要改良方式。在筛出358个与生存相关的蛋白编码基因后,利... 为分析肾透明细胞癌(KIRC)的转录组学数据,利用自注意力机制构建改良分类模型。构建了一种新的自注意力亚型识别神经网络(SSRNN),其包含了编码器和分类器部分,以自注意力机制为主要改良方式。在筛出358个与生存相关的蛋白编码基因后,利用聚类分析确定了三种亚型最为适宜。对于C1、C2和C3三组癌症亚型进行了临床信息比较和生存分析比较,揭示了各组在生存结局上的差异。SSRNN取得了最优异的分类性能,取得了93.44%的曲线下面积。基因表达热图提示三种亚型的基因表达存在差异,推测基因的低表达指示较好的生存预后。对三种亚型两两间进行差异分析并绘制火山图,共可获取266个差异基因。GO和KEGG富集分析及节点图的绘制则有利于揭示癌症相关的功能和通路。因此,SSRNN具有较高的预测精度和稳健性,可有效地利用组学数据进行KIRC的生存预测,并筛选合理的生物学标志物,具有较高的方法学意义和应用价值。 展开更多
关键词 自注意力 深度 组学数据 肾透明细胞癌 亚型识别
下载PDF
从多组学数据挖掘结核病关键基因的综合策略 被引量:2
13
作者 张旭 陈冬东 +2 位作者 叶志强 李启明 谢建平 《工程数学学报》 CSCD 北大核心 2018年第5期515-522,共8页
如何确定参与肺结核易感性的相互作用和潜在网络的关键宿主基因是一项非常重要的任务.到目前为止,只有少数宿主基因被发现和证实与结核病有关.本文利用显著性分析及聚类等数学、统计学方法分析了两组和结核病相关的组学数据,发现14个可... 如何确定参与肺结核易感性的相互作用和潜在网络的关键宿主基因是一项非常重要的任务.到目前为止,只有少数宿主基因被发现和证实与结核病有关.本文利用显著性分析及聚类等数学、统计学方法分析了两组和结核病相关的组学数据,发现14个可能性最大的结核病候选易感基因,其全部被文献报道参与各种重要的生物过程,更有五个被报道与结核病有关.这表明通过综合应用多种数学、统计学方法分析组学数据有助于缩小结核疾病相关基因的候选名单. 展开更多
关键词 组学数据 基因 显著性检验 结核病 聚类
下载PDF
模糊聚类法在动态设计组学数据趋势聚类中的应用 被引量:2
14
作者 王璐 张涛 +3 位作者 刘佳 刘盈君 公晓云 薛付忠 《中国卫生统计》 CSCD 北大核心 2015年第1期2-5,9,共5页
目的探讨模糊C均值聚类方法(FCM)在动态设计组学数据不同动态趋势聚类中的应用。方法使用模糊C均值聚类方法,分别对模拟的动态数据和动态基因表达进行聚类,识别不同的变化模式。结果对模拟数据的分析显示,FCM可以准确地识别模拟设定的... 目的探讨模糊C均值聚类方法(FCM)在动态设计组学数据不同动态趋势聚类中的应用。方法使用模糊C均值聚类方法,分别对模拟的动态数据和动态基因表达进行聚类,识别不同的变化模式。结果对模拟数据的分析显示,FCM可以准确地识别模拟设定的不同动态变化趋势,并将其聚为一类;同时,通过设定隶属度阈值我们可以避免对噪声变量的聚类。而对动态基因组表达数据的实例分析表明FCM可以有效地将具有相同表达模式的基因聚类,并且能给出类间关系。结论模糊C-均值聚类可以用于动态组学数据不同动态变化模式的聚类,帮助我们更有效地探索生物信息。 展开更多
关键词 动态组学数据 模糊C均值聚类
下载PDF
多组学数据整合分析和应用研究综述 被引量:10
15
作者 钟雅婷 林艳梅 +2 位作者 陈定甲 彭昱忠 曾远鹏 《计算机工程与应用》 CSCD 北大核心 2021年第23期1-17,共17页
随着组学新测序技术的不断涌现和推广,产生了大量的组学数据,这些数据对人们深入研究和揭示生命奥秘有着极重要的意义。利用多组学数据整合技术分析生命科学问题可获得更丰富更全面的生命系统相关信息,已成为研究者探索生命机制的新方... 随着组学新测序技术的不断涌现和推广,产生了大量的组学数据,这些数据对人们深入研究和揭示生命奥秘有着极重要的意义。利用多组学数据整合技术分析生命科学问题可获得更丰富更全面的生命系统相关信息,已成为研究者探索生命机制的新方向。介绍了多组学数据整合分析的研究背景和研究意义,综述了近年来多组学数据整合分析的方法和相关领域的应用研究,探讨了多组学数据整合分析方法当前所存在的问题以及未来展望。 展开更多
关键词 组学数据 组学数据分析 生物信息 数据整合
下载PDF
基于组学数据表达谱的下呼吸道铜绿假单胞菌毒力基因exoS和exoU的共表达网络分析 被引量:1
16
作者 焦二莉 陈博 《国际检验医学杂志》 CAS 2019年第20期2529-2533,共5页
目的以铜绿假单胞菌的基因芯片为研究样本,并对其进行组学数据层面的挖掘,旨在从分子生物学的层面阐明下呼吸道铜绿假单胞菌毒力基因exoS和exoU的共表达网络特征,并发现其关键的调控基因。方法于2016年3月至2018年5月采用定群抽样的方... 目的以铜绿假单胞菌的基因芯片为研究样本,并对其进行组学数据层面的挖掘,旨在从分子生物学的层面阐明下呼吸道铜绿假单胞菌毒力基因exoS和exoU的共表达网络特征,并发现其关键的调控基因。方法于2016年3月至2018年5月采用定群抽样的方法选取内蒙古包钢医院呼吸内科接诊并在该院接受后续治疗的312例下呼吸道铜绿假单胞菌感染者为受试对象,生物标本为患者的肺泡灌洗液及痰液。使用寡聚核苷酸探针对铜绿假单胞菌的基因进行检测,对芯片数据进行预处理。选择头孢他啶、庆大霉素、哌拉西林、阿米卡星、环丙沙星、左旋氧氟沙星、多尼培南、替卡西林共8种呼吸内科针对革兰阴性菌常用的抗菌药物对生物标本进行耐药性测定,利用MCODE算法构建以exoS/exoU为核心的耐药基因共表达网络模型。结果耐药组exoS/exoU表达量均显著高于非耐药组,差异有统计学意义(P<0.05);耐药组肺泡灌洗液标本前5位差异表达基因差异表达量从高到低排序依次为RAC1、ITGB1、ITGB5、CRK及IGF1R。痰标本顺序为RAC1、CRK、IGF1R、ITGB1及ITGB5。肺泡灌洗液标本中仅RAC1与exoS、exoU表达呈正相关性(P<0.05);痰标本中RAC1、ITGB1、ITGB5、CRK及IGF1R与exoS、exoU表达呈正相关性(P<0.05)。共表达网络中纳入的基因包括exoS、exoU、RAC1、ITGB1、ITGB5、CRK、CAMK2D、RHOA、FLNA、IGF1R、TGFBR2、FOS。其中RAC1基因调控能力评分最高(72.00),调控基因数最多(6个);其后依次为ITGB1、ITGB5及CRK基因。结论痰标本出现exoS和exoU高表达提示铜绿假单胞菌有更高概率产生耐药性;RAC1、ITGB1、ITGB5及CRK基因可能是调控exoS和exoU表达的关键基因。 展开更多
关键词 组学数据表达谱 下呼吸道 铜绿假单胞菌 exoS exoU 共表达网络
下载PDF
基于癌症基因组图谱计划多组学数据构建胶质母细胞瘤六基因预后模型 被引量:3
17
作者 雷常贵 贾学渊 孙文靖 《遗传》 CAS CSCD 北大核心 2021年第7期665-679,I0002-I0011,共25页
胶质母细胞瘤(glioblastoma,GBM)是最常见的原发性颅内肿瘤,恶性程度极高,患者预后极差。为了识别GBM预后生物标记物,建立预后模型,本研究通过分析癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)数据库中GBM的表达谱数据,筛选出不... 胶质母细胞瘤(glioblastoma,GBM)是最常见的原发性颅内肿瘤,恶性程度极高,患者预后极差。为了识别GBM预后生物标记物,建立预后模型,本研究通过分析癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)数据库中GBM的表达谱数据,筛选出不同生存期GBM患者差异基因。利用GISTIC软件和Kaplan-Meier(KM)生存分析方法分析TCGA数据库中的GBM拷贝数变异数据,识别影响生存的扩增基因(survival-associated amplified gene,SAG)。取短生存期组上调基因和SAG两者的交集基因,进行单因素Cox回归和迭代Lasso回归筛选重要候选基因并建立预后模型;计算预后评分,根据预后评分中位数将患者分为高风险组和低风险组。用ROC曲线判断模型的优良,KM生存分析高低风险组预后差异,并用GEO、CGGA和Rembrandt数据库3个外部数据集进行验证。多因素Cox回归分析判断预后评分的预后独立性。结果显示,GBM不同生存期差异分析得到上调基因426个,下调基因65个。短生存期组上调基因与SAG交集得到47个基因。经过筛选,最终确定六基因(EN2、PPBP、LRRC61、SEL1L3、CPA4、DDIT4L)预后模型。TCGA实验组和3个外部验证组模型的ROC曲线下面积均大于0.6,甚至达到0.912。KM分析显示高低风险组的预后都存在差异(P<0.05)。在多因素Cox回归分析中,六基因预后评分是GBM患者预后的独立影响因素(P<0.05)。通过一系列分析,本研究确立了六基因(EN2、PPBP、LRRC61、SEL1L3、CPA4、DDIT4L)的GBM预后模型,模型具有很好的预测能力,可作为预测GBM患者的独立预后标志物。 展开更多
关键词 胶质母细胞瘤 组学数据 六基因 预后模型 癌症基因图谱计划
下载PDF
多组学数据分析中关联网络融合ANF算法及应用研究 被引量:1
18
作者 徐臻旖 王策 +1 位作者 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2020年第6期822-827,共6页
目的引入关联网络融合(affinity network fusion,ANF)方法对多组学数据进行整合分析,并应用于肿瘤分子分型研究。方法模拟产生两组学数据,改变总体差异大小等情况比较多种多组学整合方法的效果。实例分析中目标人群选择TCGA数据库中对... 目的引入关联网络融合(affinity network fusion,ANF)方法对多组学数据进行整合分析,并应用于肿瘤分子分型研究。方法模拟产生两组学数据,改变总体差异大小等情况比较多种多组学整合方法的效果。实例分析中目标人群选择TCGA数据库中对铂类药物敏感并拥有mRNA和甲基化两个组学的卵巢癌患者,目标基因是TCGA数据库和ImmPort数据库中共有基因,目标甲基化位点是目标基因对应的所有甲基化位点。使用ANF、SNF、K-means、系统聚类和iCluster五种方法比较聚类效果。结果模拟实验提示存在总体差异的两亚型间差异较小时ANF方法的效果明显优于其他方法。实例分析结果表明,通过ANF方法进行多组学数据整合得到的分子分型较单组学得到的分子分型有更好的生物学意义且多组学聚类效果优于其他方法。结论ANF方法可以应用于多组学数据整合分析,具有实际应用意义。 展开更多
关键词 ANF方法 组学数据整合 免疫分型
下载PDF
JIVE方法在卵巢癌多组学数据整合分析中的应用 被引量:1
19
作者 徐欢 宋微 +2 位作者 蔡雨晴 侯艳 李康 《中国卫生统计》 CSCD 北大核心 2019年第5期774-776,共3页
目的引入JIVE方法对多组学数据进行整合分析,并应用于肿瘤分子分型研究。方法使用TCGA数据库中卵巢癌mRNA和miRNA的组学数据,应用JIVE方法整合分析两个组学数据,提取两不同组学数据的共同特征,然后通过对其具有共同结构的数据做主成分分... 目的引入JIVE方法对多组学数据进行整合分析,并应用于肿瘤分子分型研究。方法使用TCGA数据库中卵巢癌mRNA和miRNA的组学数据,应用JIVE方法整合分析两个组学数据,提取两不同组学数据的共同特征,然后通过对其具有共同结构的数据做主成分分析,给出卵巢癌miRNA分子分型的结果。结果经过JIVE方法整合分析后,使miRNA数据具有明显与mRNA相一致的分型结构,从而进一步支持了mRNA的分型结果,同时揭示了两组学之间在组织分子分型上具有一定的调控关系。结论JIVE方法可以用于提取组学之间存在的共同结构矩阵,从而进行多组学数据的整合分析。 展开更多
关键词 JIVE方法 组学数据整合 特征提取
下载PDF
基于多组学数据识别癌症驱动通路的模型和算法 被引量:2
20
作者 蔡齐荣 吴璟莉 《计算机科学》 CSCD 北大核心 2019年第9期310-314,共5页
通过整合体细胞突变、拷贝数变异和基因表达等3种组学数据,提出识别癌症驱动通路的改进最大权重子矩阵模型。该模型用通路中基因平均权重调控覆盖度和互斥度,对权重大的基因集覆盖度进行加强,同时放松其高互斥度约束。引入基于贪心算法... 通过整合体细胞突变、拷贝数变异和基因表达等3种组学数据,提出识别癌症驱动通路的改进最大权重子矩阵模型。该模型用通路中基因平均权重调控覆盖度和互斥度,对权重大的基因集覆盖度进行加强,同时放松其高互斥度约束。引入基于贪心算法的重组算子,提出求解该模型的单亲遗传算法PGA-MWS。采用胶质母细胞瘤和卵巢癌数据集对算法PGA-MWS和GA进行实验对比分析。实验结果显示,较GA方法,基于改进模型的PGA-MWS算法能识别出覆盖度高但互斥度不太高的基因集,且其识别的基因集中,许多均参与已知信号通路,并被证实与癌细胞密切相关,同时还能识别几种潜在的候选驱动通路,因此PGA-MWS方法可作为检测癌症驱动通路的一种有效补充。 展开更多
关键词 驱动通路 组学数据 癌症 算法 模型
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部