期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
转录组分析中批次效应的检测与矫正
1
作者 刘淏晟 张博文 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期564-574,共11页
随着测序数据的持续积累和单细胞转录组测序的广泛应用,超大规模转录组数据集的整合,为后基因组时代提供了新的机遇和挑战.其中,不同数据集具备的时空异质性和测序平台带来的系统误差导致的批次效应,对转录组分析的有效性产生了极大影响... 随着测序数据的持续积累和单细胞转录组测序的广泛应用,超大规模转录组数据集的整合,为后基因组时代提供了新的机遇和挑战.其中,不同数据集具备的时空异质性和测序平台带来的系统误差导致的批次效应,对转录组分析的有效性产生了极大影响,干扰了真实的生物学差异的研究.本文介绍了转录组分析中批次效应的产生原因和检测方法,并对基于参数估计和非参数的矫正模型以及针对单细胞转录组的整合算法进行了总结.结合主流的分析方法,给出批次效应矫正的实践建议,为相关转录组研究的综合分析提供参考意见. 展开更多
关键词 转录组分析 批次效应 批次效应矫正
下载PDF
单细胞RNA测序数据批次效应校正方法
2
作者 王文杰 李康 谢宏宇 《中国卫生统计》 CSCD 北大核心 2023年第1期153-156,共4页
传统的“bulk”RNA测序通过测量一个细胞群中基因的平均表达水平来描述一个组织的整体状态,掩盖了单个细胞的信号及组织内细胞异质性。单细胞RNA测序(single-cell RNA-sequencing,scRNA-seq)是近年来新兴的检测技术,通过单个细胞的转录... 传统的“bulk”RNA测序通过测量一个细胞群中基因的平均表达水平来描述一个组织的整体状态,掩盖了单个细胞的信号及组织内细胞异质性。单细胞RNA测序(single-cell RNA-sequencing,scRNA-seq)是近年来新兴的检测技术,通过单个细胞的转录图谱分析其分子状态[1],在描绘细胞微环境,阐述相关生物学机制,识别新的治疗靶点等方面取得了前所未有的进展[2]。scRNA-seq数据通常由多批次实验数据整合而成,批次效应主要来源于实验数据的获取时间、操作人员、试剂批次、设备及检测技术平台等方面。批次效应可能是高度非线性的,它的存在使得下游分析复杂化,结果难以解释。因此,有效地移除scRNA-seq数据批次效应至关重要。 展开更多
关键词 批次效应 分子状态 生物学机制 细胞微环境 数据整合 细胞群 校正方法 整体状态
下载PDF
单细胞转录组数据批次效应评测的研究进展
3
作者 李小刚 高正 +3 位作者 陈佳锋 冯山入 傅修涛 丁振斌 《生物信息学》 2023年第3期155-160,共6页
单细胞转录组测序(Single cell RNA sequencing,ScRNA seq)是一种变革性的生物技术,以前所未有的高分辨率来解析组织复杂性,解决了普通转录组测序(Bulk RNA sequencing)无法回答的问题。但单细胞数据的高通量及复杂性给分析带来极大难度... 单细胞转录组测序(Single cell RNA sequencing,ScRNA seq)是一种变革性的生物技术,以前所未有的高分辨率来解析组织复杂性,解决了普通转录组测序(Bulk RNA sequencing)无法回答的问题。但单细胞数据的高通量及复杂性给分析带来极大难度,批次效应(Batch effects,BEs)的处理便是主要挑战之一。批次效应是高通量生物数据分析中的技术性偏倚,其来源及处理具有高复杂性和研究依赖性。根据组织类型、测序技术及实验设计的不同,测序数据需采用不同的评估、分析、测量及处置流程来实现有效的批次效应处理。评测批次效应在单细胞数据分析中极易被忽略,但却有助于判断批次效应的来源、对数据变异的解释度、对数据分析结果的影响度及处理方法,是有效处理批次效应的基础。因此,本篇综述聚焦单细胞转录组数据的批次效应,分别论述批次效应的概念、与普通转录组批次效应的区别、评测方法及面临的挑战,并对未来发展做出展望。 展开更多
关键词 单细胞测序 批次效应 评测 未来展望
下载PDF
批次效应对二元退化系统可靠性的影响
4
作者 段碧玉 闫在在 《内蒙古工业大学学报(自然科学版)》 2023年第3期193-199,共7页
利用随机过程建立退化系统模型时,考虑个体退化过程和相关性差异,即模型中加入退化特征多元化,并存在批次效应。退化模型中随机参数采用非共轭先验分布假设,分析随机参数对系统可靠度的影响,在此基础上,采用贝叶斯马尔可夫链蒙特卡罗方... 利用随机过程建立退化系统模型时,考虑个体退化过程和相关性差异,即模型中加入退化特征多元化,并存在批次效应。退化模型中随机参数采用非共轭先验分布假设,分析随机参数对系统可靠度的影响,在此基础上,采用贝叶斯马尔可夫链蒙特卡罗方法对未知参数进行估计。由于似然方程包含未知参数多,采用智能优化算法,再通过计算此类系统实例进行可靠性分析验证考虑退化相关性和个体退化过程批次效应的必要性。 展开更多
关键词 WIENER过程 批次效应 COPULA函数 可靠性
下载PDF
不同孵化批次效应对后代生产性能的影响 被引量:1
5
作者 刘胜军 杨宁 《中国畜牧杂志》 CAS 北大核心 2001年第5期25-26,共2页
利用Harvey程序 ,估计了来航鸡A、B、C三个纯系产蛋性状的不同孵化批次效应 ,A、B、C三个系是已经过多年选育的育种核心群 ,群体规模分别为 2 0 0、1 4 4、1 84只公鸡及 3 2 84、2 65 0、3 1 65只母鸡 ,每只母鸡都有 2 1~ 65周龄的个... 利用Harvey程序 ,估计了来航鸡A、B、C三个纯系产蛋性状的不同孵化批次效应 ,A、B、C三个系是已经过多年选育的育种核心群 ,群体规模分别为 2 0 0、1 4 4、1 84只公鸡及 3 2 84、2 65 0、3 1 65只母鸡 ,每只母鸡都有 2 1~ 65周龄的个体产蛋记录。结果表明 ,不同孵化批次效应在三个系中对种鸡生产性能的影响不一致 。 展开更多
关键词 白来航鸡 孵化批次 Harvey程序 产蛋性状 批次效应 后代 生产性能
下载PDF
全基因组DNA甲基化芯片数据批次效应的评价 被引量:1
6
作者 姚晨 李红东 郭政 《数理医药学杂志》 2011年第2期142-144,共3页
DNA甲基化芯片已广泛应用于癌症研究。但是有研究表明批次效应对基于高通量数据的研究有很大影响。癌症基因组计划(TCGA)数据库包含大量的不同批次的高通量甲基化数据。通过分析TCGA中7种癌症的数据,发现批次效应在各种类型的癌症数据... DNA甲基化芯片已广泛应用于癌症研究。但是有研究表明批次效应对基于高通量数据的研究有很大影响。癌症基因组计划(TCGA)数据库包含大量的不同批次的高通量甲基化数据。通过分析TCGA中7种癌症的数据,发现批次效应在各种类型的癌症数据中都广泛存在,可能会导致错误的生物学分析结论。最后,建议用一个简单的方法来避免批次效应。 展开更多
关键词 TCGA 批次效应 甲基化芯片
下载PDF
随机森林回归分析方法在代谢组学批次效应移除中的应用 被引量:2
7
作者 谭起龙 邓魁 +1 位作者 李康 李贞子 《中国卫生统计》 CSCD 北大核心 2020年第5期667-671,共5页
目的通过随机森林回归(random forest,RF)方法提取不同批次间质控(quality control,QC)样本数据的批次特征,从而移除代谢组研究样本数据的批次效应,提高统计分析方法的分类识别能力。方法利用心血管疾病的代谢组质控样本在检测过程中产... 目的通过随机森林回归(random forest,RF)方法提取不同批次间质控(quality control,QC)样本数据的批次特征,从而移除代谢组研究样本数据的批次效应,提高统计分析方法的分类识别能力。方法利用心血管疾病的代谢组质控样本在检测过程中产生的系统误差,通过随机森林回归方法获得质控样本质谱数据的系统误差特征,从而移除研究样本数据中存在的批次效应。对校正后的质谱数据用可视化方法和定量度量指标进行评价,再用统计方法筛选差异变量和建立判别模型,评价移除效果。结果经过QC-RF回归方法移除批次效应后的质谱数据分类判别效果明显优于使用QC-LOESS方法、ComBat方法和原始数据得到的结果。结论对于代谢组学质谱数据,QC-RF回归方法能够移除批次效应,提高数据的有效性和稳定性,具有实际应用价值。 展开更多
关键词 代谢组学 质谱数据 批次效应 随机森林回归
下载PDF
基因表达数据批次效应去除方法的研究进展 被引量:1
8
作者 李飒 赵毅强 《南京农业大学学报》 CAS CSCD 北大核心 2019年第3期389-397,共9页
在组学和大数据时代,整合分析材料相同但时间、平台、方法、技术和实验室等不同批次的表达数据集将成为常态。但是,不同批次数据集由于非生物因素影响会产生批次效应,这种批次效应可能会对试验结果产生严重影响,甚至导致错误结论。本文... 在组学和大数据时代,整合分析材料相同但时间、平台、方法、技术和实验室等不同批次的表达数据集将成为常态。但是,不同批次数据集由于非生物因素影响会产生批次效应,这种批次效应可能会对试验结果产生严重影响,甚至导致错误结论。本文介绍了几种去除基因表达数据批次效应的方法,包括ComBat方法、替代变量分析法、距离加权判别法和基于比值的方法等。通过前人研究和实例分析表明,ComBat方法是最好的去除基因表达谱数据集批次效应的方法。这些结果将为多批次表达数据集的整合分析提供参考依据。 展开更多
关键词 批次效应 基因表达谱 数据合并 评估方法
下载PDF
利用基因表达值相对大小秩序标志鉴别肺癌 被引量:1
9
作者 陈燕花 郑宝童 +5 位作者 林云轻 朱慧敏 郑智军 关庆洲 郭政 严海丹 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2017年第1期129-133,共5页
在应用基于转录组特征构建的支持向量机、贝叶斯分类器等传统分类器对组织样本进行分类时,要求对基因表达谱进行样本间的数据标准化处理,以去除实验批次效应带来的影响,因此限制了这些分类器在个体化水平上的应用。本文旨在构建鉴别肺... 在应用基于转录组特征构建的支持向量机、贝叶斯分类器等传统分类器对组织样本进行分类时,要求对基因表达谱进行样本间的数据标准化处理,以去除实验批次效应带来的影响,因此限制了这些分类器在个体化水平上的应用。本文旨在构建鉴别肺癌组织与非癌(肺炎与肺正常)组织的个体化分类器。文中采用来自多组独立数据的197例肺癌与189例肺非癌组织样本作为训练集,筛选得到了3对基因作为特征,应用多数投票规则区分肺癌组织与肺非癌组织的平均准确率达到95.34%。然后,本文采用来自多组独立数据的251例肺癌组织与141例肺非癌组织样本的非标化数据进行独立验证,其平均准确率达到96.78%。因此,本文提出的该分类器可对由不同实验室检测的样本进行个体化判断提供一种新的思路,具有较强的临床实用性。 展开更多
关键词 标志 分类器 肺癌 数据标准化 批次效应
原文传递
不明原因复发性流产患者的基因表达谱亚组分析
10
作者 林泳煌 刘兴华 +4 位作者 王红心 杨晓雨 樊文龙 陈东宇 何玉清 《中国妇幼保健》 CAS 2022年第19期3629-3634,共6页
目的探讨不明原因的复发性流产(RSA)患者的基因表达谱的异质性,确定亚组子宫内膜生物学过程的区别。方法从GEO数据库中获取GSE165004和GSE26787基因表达序列,应用ComBat方法去除批次效应后,应用Consensus Clustering方法对29个病例组进... 目的探讨不明原因的复发性流产(RSA)患者的基因表达谱的异质性,确定亚组子宫内膜生物学过程的区别。方法从GEO数据库中获取GSE165004和GSE26787基因表达序列,应用ComBat方法去除批次效应后,应用Consensus Clustering方法对29个病例组进行无监督聚类并分成3个亚组(RSA1、RSA2、RSA3),3个亚组再分别与对照组进行差异表达分析。利用GO富集和KEGG富集对差异表达基因(DEGs)进行生物学功能和途径注释。应用cytoHubba识别中心基因。结果RSA1和对照组主要富集在与核分裂、细胞分裂等细胞周期相关,代谢途径有蛋白质消化吸收和细胞外基质(ECM)受体相互作用;RSA2组和脂质、氨基酸代谢过程的调控有关,代谢途径主要有花生四烯酸代谢和甲状腺激素合成;RSA3组和金属离子等细胞信号有关。结论RSA1亚组的细胞周期明显失调;RSA2亚组的脂质、氨基酸代谢失调;RSA3亚组的细胞信号失调。 展开更多
关键词 复发性流产 亚组分析 批次效应 一致性聚类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部