期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
A Tight Prediction Interval for False Discovery Proportion under Dependence
1
作者 Shulian Shang Mengling Liu Yongzhao Shao 《Open Journal of Statistics》 2012年第2期163-171,共9页
The false discovery proportion (FDP) is a useful measure of abundance of false positives when a large number of hypotheses are being tested simultaneously. Methods for controlling the expected value of the FDP, namely... The false discovery proportion (FDP) is a useful measure of abundance of false positives when a large number of hypotheses are being tested simultaneously. Methods for controlling the expected value of the FDP, namely the false discovery rate (FDR), have become widely used. It is highly desired to have an accurate prediction interval for the FDP in such applications. Some degree of dependence among test statistics exists in almost all applications involving multiple testing. Methods for constructing tight prediction intervals for the FDP that take account of dependence among test statistics are of great practical importance. This paper derives a formula for the variance of the FDP and uses it to obtain an upper prediction interval for the FDP, under some semi-parametric assumptions on dependence among test statistics. Simulation studies indicate that the proposed formula-based prediction interval has good coverage probability under commonly assumed weak dependence. The prediction interval is generally more accurate than those obtained from existing methods. In addition, a permutation-based upper prediction interval for the FDP is provided, which can be useful when dependence is strong and the number of tests is not too large. The proposed prediction intervals are illustrated using a prostate cancer dataset. 展开更多
关键词 Multiple Testing false discovery PROPORTION false discovery rate Weak DEPENDENCE Correlated Test Statistics HIGH-DIMENSIONAL Data Analysis PREDICTION Interval Upper PREDICTION Bound Permutation-Based Method
下载PDF
自适应性FDR控制程序原理及组学数据应用
2
作者 王子兴 薛芳 姜晶梅 《中国卫生统计》 CSCD 北大核心 2023年第1期68-73,共6页
目的高维组学数据分析常伴随多重检验问题,不当处理可造成检验效能低下或阳性发现错误率(FDR)升高。FDR已发展为一类新的控制标准,衍生出一系列理论和方法。方法本研究首先对一类自适应性FDR控制方法原理及条件进行介绍,其基于Benjamini... 目的高维组学数据分析常伴随多重检验问题,不当处理可造成检验效能低下或阳性发现错误率(FDR)升高。FDR已发展为一类新的控制标准,衍生出一系列理论和方法。方法本研究首先对一类自适应性FDR控制方法原理及条件进行介绍,其基于Benjamini-Hochberg程序,由数据自适应性地估计真实原假设数(m 0)进而对FDR实现控制;具体方法包括迭代式、分位数(中位数、定值)、多阶段、阈值函数调整、m 0外插等。进一步,将上述方法用于肺癌患者CT图像特征和COVID-19患者血清蛋白表达两个实例分析。结果相对两项分析中的控制前结果,各自适应性FDR控制方法均降低了阳性发现数,并相比Bonferroni校正结果很大程度保留了阳性比例。然而蛋白表达实例提示,该类程序无法从根本上解决结果不稳定性问题。通过数据拆分验证,适当降低拟控制水平并以各方法的结果进行综合评估,可使筛选结果稳定性得到一定程度提升。结论由于自适应性FDR控制程序基于样本估计m 0且需满足特定结构假设,高维小样本组学数据的结构复杂性可对其分析效果产生影响,故建议进行方法间的联合应用和综合评价。在阳性发现比例较大时,经典的线性递增程序不失为一种简易、稳健且有效的FDR控制方法。 展开更多
关键词 阳性发现错误率 多重检验 组学数据 自适应性控制程序
下载PDF
Screening-Assisted Dynamic Multiple Testing with False Discovery Rate Control
3
作者 MUSHTAQ Iram ZHOU Qin ZI Xuemin 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2023年第2期716-754,共39页
In the era of big data,high-dimensional data always arrive in streams,making timely and accurate decision necessary.It has become particularly important to rapidly and sequentially identify individuals whose behavior ... In the era of big data,high-dimensional data always arrive in streams,making timely and accurate decision necessary.It has become particularly important to rapidly and sequentially identify individuals whose behavior deviates from the norm.Aiming at identifying as many irregular behavioral patterns as possible,the authors develop a large-scale dynamic testing system in the framework of false discovery rate(FDR)control.By fully exploiting the sequential feature of datastreams,the authors propose a screening-assisted procedure that filters streams and then only tests streams that pass the filter at each time point.A data-driven optimal screening threshold is derived,giving the new method an edge over existing methods.Under some mild conditions on the dependence structure of datastreams,the FDR is shown to be strongly controlled and the suggested approach for determining screening thresholds is asymptotically optimal.Simulation studies show that the proposed method is both accurate and powerful,and a real-data example is used for illustrative purpose. 展开更多
关键词 CHANGE-POINT false discovery rate high-dimensional datastreams large-scale inference sequential analysis weak dependence structure
原文传递
Support Recovery of Gaussian Graphical Model with False Discovery Rate Control
4
作者 ZHANG Yuhao LIU Yanhong WANG Zhaojun 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2023年第6期2605-2623,共19页
This paper focuses on the support recovery of the Gaussian graphical model(GGM)with false discovery rate(FDR)control.The graceful symmetrized data aggregation(SDA)technique which involves sample splitting,data screeni... This paper focuses on the support recovery of the Gaussian graphical model(GGM)with false discovery rate(FDR)control.The graceful symmetrized data aggregation(SDA)technique which involves sample splitting,data screening and information pooling is exploited via a node-based way.A matrix of test statistics with symmetry property is constructed and a data-driven threshold is chosen to control the FDR for the support recovery of GGM.The proposed method is shown to control the FDR asymptotically under some mild conditions.Extensive simulation studies and a real-data example demonstrate that it yields a better FDR control while offering reasonable power in most cases. 展开更多
关键词 false discovery rate Gaussian graphical model support recovery symmetrized data aggregation
原文传递
基于LASSO的FDR控制方法及其在高维数据生存分析中的应用 被引量:5
5
作者 许树红 董晓强 +4 位作者 陶然 高雪 高倩 虞明星 王彤 《中国卫生统计》 CSCD 北大核心 2018年第3期322-329,共8页
目的基于LASSO-Cox模型探索交叉验证(cross validation)、pcvl法(penalized cross-validated log-likelihood)、EBIC准则(extended bayesian information criterion)、平稳选择(stability selection)四种方法在控制FDR(false discovery ... 目的基于LASSO-Cox模型探索交叉验证(cross validation)、pcvl法(penalized cross-validated log-likelihood)、EBIC准则(extended bayesian information criterion)、平稳选择(stability selection)四种方法在控制FDR(false discovery rate)方面的表现及其变量选择效果。方法通过模拟研究评价各方法在不同删失比例、自变量间不同相关程度以及回归系数的不同稀疏水平下的FDR和PSR(positive select rate),并从GEO上下载DLBCL数据进行基因与预后间的关联分析。结果模拟结果表明,在不同删失比例、自变量相关程度和稀疏水平的情况下,平稳选择法控制FDR的能力都优于其他方法且其变量选择效能也较高。EBIC准则在相关程度低、自变量较稀疏时表现较好,当样本量较小时结果较保守。pcvl法虽然不容易漏掉有效应的变量,但其FDR仍较高。实例结果显示,EBIC准则只选出1个基因,平稳选择法选出的基因中大部分有统计学意义且与其他方法的结果重合度高。结论在基于LASSO-Cox模型的高维数据生存分析中平稳选择法能较好地控制FDR且其变量选择效能也较高。 展开更多
关键词 LASSO 生存分析 调整参数 错误发现率
下载PDF
中国基金业绩中的运气——来自FDR方法的证据 被引量:5
6
作者 唐涯 刘玉珍 杨逸 《金融学季刊》 CSSCI 2014年第1期149-170,共22页
基于传统的定价模型计算超额收益的方法,并不能排除那些仅仅因为运气因素而显得创造了超额收益的基金。本文应用“False Discovery Rate”(FDR)的统计方法研究中国基金在调整运气成分后的真实业绩。实证发现:过去十年中,我国开放... 基于传统的定价模型计算超额收益的方法,并不能排除那些仅仅因为运气因素而显得创造了超额收益的基金。本文应用“False Discovery Rate”(FDR)的统计方法研究中国基金在调整运气成分后的真实业绩。实证发现:过去十年中,我国开放式基金的业绩更像“运气成分”的镜像。在调整运气因素后,仅有7.9%的基金真正能够为投资者创造价值。在业绩出色的基金中,有65.8%都是由于运气而非自己的能力,然而在业绩较差的基金中,有37.6%是由于运气不佳所致。本文还发现,基金家族是影响基金业绩的一个重要因素。根据基金家族规模和其他基金特征,我们可以比较有效地选择出那些在剔除了“好运”后,仍真正有能力为投资者创造价值的基金。 展开更多
关键词 基金业绩 fdr 运气因素
下载PDF
利用条件错误发现率方法识别抑郁症和失眠症的多效性位点
7
作者 宋文超 楚利君 马静 《四川精神卫生》 2024年第3期198-204,共7页
背景 抑郁症和失眠症常共病存在,两者存在一些共同的发病机制,并可能受相同的多效性基因调控。既往全基因组关联研究(GWAS)一般采用单性状研究,在解释基因多效性方面存在一定的狭窄性。目的 识别与失眠症和抑郁症相关的遗传变异位点,检... 背景 抑郁症和失眠症常共病存在,两者存在一些共同的发病机制,并可能受相同的多效性基因调控。既往全基因组关联研究(GWAS)一般采用单性状研究,在解释基因多效性方面存在一定的狭窄性。目的 识别与失眠症和抑郁症相关的遗传变异位点,检验抑郁症和失眠症是否存在共同的遗传因素。方法 抑郁症GWAS数据来自精神疾病遗传学联盟(PGC),共包含246 363例抑郁症患者和561 190例正常对照。失眠症GWAS数据来自睡眠障碍知识门户,共包含1 331 010例受试者。采用条件错误发现率(cFDR)和联合的条件错误发现率(ccFDR)方法筛选与抑郁症和失眠症相关的遗传位点,采用通路富集分析检验这些位点的生物学功能。结果 抑郁症和失眠症存在显著的多效性富集现象。利用cFDR方法,以cFDR<0.01作为显著性阈值,鉴定出21个易感位点与抑郁症相关(其中17个是新识别的),38个易感位点与失眠症相关(其中28个是新识别的)。以ccFDR<0.05为显著性阈值,识别出16个多效性位点与抑郁症和失眠症均相关,其中15个是本研究新识别的。通路富集分析结果显示,与抑郁症和失眠症均关联的易感位点富集于突触传递相关通路,如突触后密度(GO:0014069,P=4.91E-04,FDR=4.84E-03)、不对称突触(GO:0032279,P=5.09E-0,FDR=4.84E-03)、突触后膜神经递质受体水平的调节(GO:0099072,P=5.11E-04,FDR=1.69E-02)。结论 失眠症与抑郁症之间存在多效性富集现象,其共病机制与突触传递有关。 展开更多
关键词 抑郁症 失眠症 基因多效性 条件错误发现率 全基因组关联研究
下载PDF
一种多检验方法FDR在脑功能磁共振成像(fMRI)处理中的应用
8
作者 黄丽萍 赵小杰 +1 位作者 姚力 金真 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第3期422-426,F003,共6页
对一种多检验方法———错误发现率 (FDR)方法进行了计算机实现 ,并将FDR方法及其他几种假设检验方法应用在模拟数据和fMRI数据分析中进行比较 。
关键词 脑功能磁共振成像 数据处理 假设检验 多检验方法 fdr 错误发现率
下载PDF
具有错误发现率控制的网络连接数据变量选择
9
作者 卢滢 李阳 《计算机系统应用》 2024年第5期28-36,共9页
网络连接数据的统计推断问题已成为近年来统计学研究的热点问题.传统模型中样本数据间的独立性假设通常不能满足现代网络连接数据的分析需求.本文研究了网络连接数据中每个节点的独立效应,并借助融合惩罚的思想,使得相互连接节点的独立... 网络连接数据的统计推断问题已成为近年来统计学研究的热点问题.传统模型中样本数据间的独立性假设通常不能满足现代网络连接数据的分析需求.本文研究了网络连接数据中每个节点的独立效应,并借助融合惩罚的思想,使得相互连接节点的独立效应趋同.同时借助仿变量方法 (Knockoff)仿冒原始变量的数据依赖结构、构造与目标变量无关的属性特征,提出了针对网络连接数据进行变量选择的仿变量方法 (NLKF).从理论上证明了NLKF方法将变量选择的错误发现率(FDR)控制在目标水平.对于原始数据协方差未知的情形,使用估计的协方差矩阵仍具有上述良好的统计性质.通过与传统变量选择方法 Lasso对比,说明了本文方法的可靠性.最后结合因子投资领域2022年1–12月中国A股市场4 000只股票的200个因子数据及每只股票所属申万一级行业构造的网络关系,给出模型的应用实例. 展开更多
关键词 网络连接数据 变量选择 Knockoff方法 错误发现率
下载PDF
Knockoff方法研究进展综述
10
作者 袁攀旭 李高荣 《应用概率统计》 CSCD 北大核心 2024年第3期463-497,共35页
随着现代科学技术的快速发展,大数据时代正向我们走来.此时,统计方法的可重复性对于提高科学研究的严谨性至关重要.Barber和Candès[48]提出的knockoff方法是一种可结合任意特征重要性得分的变量选择算法,在发现真实效应的同时严格... 随着现代科学技术的快速发展,大数据时代正向我们走来.此时,统计方法的可重复性对于提高科学研究的严谨性至关重要.Barber和Candès[48]提出的knockoff方法是一种可结合任意特征重要性得分的变量选择算法,在发现真实效应的同时严格控制错误发现率(false discovery rate,FDR),其核心想法是构造称为knockoff的合成变量来模仿原始变量之间的相关结构.该方法无需计算p-值而在近年来受到广泛关注,成为当今统计和机器学习最热点的研究领域.本文主要介绍knockoff方法的最新研究进展,并简要探讨未来可能的研究方向. 展开更多
关键词 knockoff方法 多重假设检验 错误发现率 高维数据 稀疏性 变量选择 可重复性
下载PDF
基于自由分布式FDR假设检验阈值算法的信号去噪
11
作者 张天瑜 《长春工业大学学报》 CAS 2009年第6期683-689,共7页
在小波阈值去噪算法中存在的主要问题是阈值的设定和阈值函数的选取。Donoho提出的通用阈值在实际的应用中效果并不十分理想。利用统计学中的自由分布式错误发现率假设检验方法来设定阈值,使得该阈值不依赖于信号的长度,并在软阈值函数... 在小波阈值去噪算法中存在的主要问题是阈值的设定和阈值函数的选取。Donoho提出的通用阈值在实际的应用中效果并不十分理想。利用统计学中的自由分布式错误发现率假设检验方法来设定阈值,使得该阈值不依赖于信号的长度,并在软阈值函数和硬阈值函数的基础上提出一种改进型阈值函数。仿真结果表明,与Donoho提出的小波阈值去噪算法相比,该算法具有更好的去噪性能。 展开更多
关键词 小波分析 信号去噪 阚值 闻值函数 错误发现率
下载PDF
基于自由分布式FDR假设检验阈值算法的图像去噪
12
作者 张天瑜 《陕西科技大学学报(自然科学版)》 2010年第1期118-123,共6页
小波阈值去噪算法中的核心问题是阈值的设定和阈值函数的选取.Donoho提出的通用阈值在实际的应用中效果并不十分理想.作者利用统计学中的自由分布式错误发现率假设检验方法来设定阈值,使得该阈值不依赖于信号的长度,并在软阈值函数和硬... 小波阈值去噪算法中的核心问题是阈值的设定和阈值函数的选取.Donoho提出的通用阈值在实际的应用中效果并不十分理想.作者利用统计学中的自由分布式错误发现率假设检验方法来设定阈值,使得该阈值不依赖于信号的长度,并在软阈值函数和硬阈值函数的基础上提出了一种改进型阈值函数.仿真结果表明,与Donoho提出的小波阈值去噪算法相比,FDR阈值和改进型阈值函数的组合具有更好的去噪性能. 展开更多
关键词 小波分析 图像去噪 阈值 阈值函数 错误发现率
下载PDF
基于FDR阈值自动选取的拖拉机PTO转矩载荷谱外推 被引量:4
13
作者 王禹 王玲 +2 位作者 吕东晓 温昌凯 王书茂 《农业机械学报》 EI CAS CSCD 北大核心 2021年第3期364-372,共9页
针对时域外推过程中常用的阈值选取计算复杂、精度低等问题,基于错误发现率(False discovery rate,FDR)提出了一种阈值自动选取方法,并基于该方法进行了拖拉机动力输出轴(Power take-off,PTO)转矩载荷谱外推研究。首先,利用开发的拖拉机... 针对时域外推过程中常用的阈值选取计算复杂、精度低等问题,基于错误发现率(False discovery rate,FDR)提出了一种阈值自动选取方法,并基于该方法进行了拖拉机动力输出轴(Power take-off,PTO)转矩载荷谱外推研究。首先,利用开发的拖拉机PTO转矩无线监测系统采集拖拉机作业工况下的载荷数据,并进行数据预处理;将顺序拟合检验与多重检验相结合,采用FDR自动阈值选取法选取了最优阈值,确定了时域外推数据的上限阈值为342 N·m,下限阈值为100 N·m;基于极大似然估计对超阈值数据进行了广义帕累托分布(Generalized Pareto distribution,GPD)尺度参数和形状参数的拟合,建立了PTO转矩载荷的超阈值模型,并与传统图像法的拟合结果进行了比较,结果表明,两种方法的拟合结果与载荷样本的决定系数均大于0.995;从拟合优度来看,对于上限阈值,自动阈值选取法的拟合优度比图像法的拟合优度降低8.7%,而对于下限阈值,自动阈值选取法比图像法降低31.21%。利用时域外推方法对PTO转矩载荷数据进行外推,对外推1倍后的载荷时间历程与原载荷时间历程进行对比分析;当时域外推因子为131、PTO转矩累积频次达到106次时,得到了PTO转矩载荷谱;基于统计学特征与雨流计数分析对外推载荷谱进行了验证,结果表明,外推后的载荷谱与样本载荷谱分布规律一致,能够在保留载荷特征的前提下实现均值、幅值的双向外推。 展开更多
关键词 拖拉机 动力输出轴 载荷谱 时域外推 广义帕累托分布 错误发现率
下载PDF
分层FDR阈值滤波算法 被引量:1
14
作者 李丽婧 黄永东 《计算机工程》 CAS CSCD 北大核心 2011年第1期187-189,193,共4页
在已有的FDR滤波算法基础上,提出一种分层FDR阈值滤波算法。该算法对小波分解后最底层的低频系数和各层的高频系数分别进行多假设检验,并确定出多个阈值,分别进行阈值化处理。对heavysine,bumps,doppler,blocks信号进行仿真实验,结果表... 在已有的FDR滤波算法基础上,提出一种分层FDR阈值滤波算法。该算法对小波分解后最底层的低频系数和各层的高频系数分别进行多假设检验,并确定出多个阈值,分别进行阈值化处理。对heavysine,bumps,doppler,blocks信号进行仿真实验,结果表明,该分层FDR阈值滤波算法在信噪比、相对误差等方面均优于通用阈值算法、FDR算法及自由分布式FDR算法,具有较高的实用价值。 展开更多
关键词 滤波 小波 阈值 假设检验 错判率 分层
下载PDF
Estimation of statistical power and false discovery rate of QTL mapping methods through computer simulation 被引量:3
15
作者 LI HuiHui ZHANG LuYan WANG JianKang 《Chinese Science Bulletin》 SCIE CAS 2012年第21期2701-2710,共10页
Many QTL mapping methods have been developed in the past two decades.Statistically,the best method should have a high detection power but a low false discovery rate (FDR).Power and FDR cannot be derived theoretically ... Many QTL mapping methods have been developed in the past two decades.Statistically,the best method should have a high detection power but a low false discovery rate (FDR).Power and FDR cannot be derived theoretically for most QTL mapping methods,but they can be properly evaluated using computer simulations.In this paper,we used four genetic models (two for independent loci and two for linked loci) to illustrate power and FDR estimation for interval mapping (IM) and inclusive composite interval mapping (ICIM).For each model,we simulated 1000 populations each of 200 doubled haploids.A support interval (SI) was first defined to indicate to which predefined QTL the significant QTL belonged.Power was calculated by counting the number of simulation runs with significant peaks higher than the logarithm of odds (LOD) threshold in the SI.Quantitative trait loci not identified in any SIs were viewed as false positives.The FDR is the rate at which QTLs are identified as significant when they are actually non-significant.Simulation results allowed us to estimate power and FDR of IM and ICIM for two independent and two linkage genetic models.Our estimates allowed us to readily compare the efficiencies of different statistical methods for QTL mapping,including the ability to separate linkage,under a wide range of genetic models.We used IM and ICIM as examples of how to estimate power and FDR,but the principles shown in this paper can be used for power analysis and comparison of any other QTL mapping methods,especially those based on interval tests. 展开更多
关键词 QTL定位 计算机模拟 定位方法 统计方法 估计 假发 遗传模型 复合区间作图
原文传递
Null-free False Discovery Rate Control Using Decoy Permutations 被引量:1
16
作者 Kun He Mengjie Li +2 位作者 Yan Fu Fuzhou Gong Xiaoming Sun 《Acta Mathematicae Applicatae Sinica》 SCIE CSCD 2022年第2期235-253,共19页
The traditional approaches to false discovery rate(FDR)control in multiple hypothesis testing are usually based on the null distribution of a test statistic.However,all types of null distributions,including the theore... The traditional approaches to false discovery rate(FDR)control in multiple hypothesis testing are usually based on the null distribution of a test statistic.However,all types of null distributions,including the theoretical,permutation-based and empirical ones,have some inherent drawbacks.For example,the theoretical null might fail because of improper assumptions on the sample distribution.Here,we propose a null distributionfree approach to FDR control for multiple hypothesis testing in the case-control study.This approach,named target-decoy procedure,simply builds on the ordering of tests by some statistic or score,the null distribution of which is not required to be known.Competitive decoy tests are constructed from permutations of original samples and are used to estimate the false target discoveries.We prove that this approach controls the FDR when the score function is symmetric and the scores are independent between different tests.Simulation demonstrates that it is more stable and powerful than two popular traditional approaches,even in the existence of dependency.Evaluation is also made on two real datasets,including an arabidopsis genomics dataset and a COVID-19 proteomics dataset. 展开更多
关键词 multiple testing false discovery rate null distribution-free p-value-free decoy permutations knockoff filter
原文传递
基于Knockoff-Logistic的多因子量化选股研究
17
作者 王小燕 周颖 +1 位作者 唐婷婷 张中艳 《统计与信息论坛》 CSSCI 北大核心 2023年第4期19-32,共14页
在数据驱动时代,如何挖掘金融资产的信息、挑选恰当的资产,对稳定收益、控制风险意义重大。多因子量化模型是选择股票的常用方法,选取最优解释力的因子集合是其主要目的之一。现有因子选择方法没有考虑到控制错误发现率(FDR),不利于构... 在数据驱动时代,如何挖掘金融资产的信息、挑选恰当的资产,对稳定收益、控制风险意义重大。多因子量化模型是选择股票的常用方法,选取最优解释力的因子集合是其主要目的之一。现有因子选择方法没有考虑到控制错误发现率(FDR),不利于构建稳健的投资策略。为此,在Logistic回归的基础上引入Knockoff方法进行因子选择,通过Lasso实现因子选择,利用Knockoff控制变量选择的FDR从而提高准确率。基于所选因子,在Logistic回归下进行股票预测,并与线性判别分析、支持向量机以及随机森林模型的预测结果进行对比。对沪深300指数和中证500指数成分股2007—2020年的数据进行实证研究,采用滑动回归法进行收益预测,并建立季度换仓的投资策略。研究表明,从变量选择上来看,基于Knockoff方法选出的因子所构造的选股模型具有更好的市场表现;从模型对比上来看,Logistic回归预测的投资组合具备高收益、低风险的优势。综合来看,将Knockoff方法引入到多因子选股模型有利于提高因子选择的准确度,对优化资产配置具有参考意义。 展开更多
关键词 监督型分类 错误发现率 因子选择 投资组合 变量选择
下载PDF
蛋白质组学肽段鉴定可信度评价方法
18
作者 周文婧 曾文锋 +1 位作者 迟浩 贺思敏 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2023年第1期109-125,共17页
蛋白质组学基于质谱数据鉴定肽段和蛋白质,从而给出基因表达的直接证据,帮助解析蛋白质的结构和功能,研究蛋白质与疾病的关系,提供靶向治疗方案,而这些都取决于鉴定的肽段和蛋白质的准确性。蛋白质组学常采用目标-诱饵库方法 (target-de... 蛋白质组学基于质谱数据鉴定肽段和蛋白质,从而给出基因表达的直接证据,帮助解析蛋白质的结构和功能,研究蛋白质与疾病的关系,提供靶向治疗方案,而这些都取决于鉴定的肽段和蛋白质的准确性。蛋白质组学常采用目标-诱饵库方法 (target-decoy approach,TDA)对鉴定的肽段和蛋白质进行质量控制,并对其进行改进演化后应用到子类肽段(比如突变肽段和修饰肽段等)和交联肽段等特殊鉴定结果的可信度评价中。然而,TDA存在两个局限,即错误率估计值不够准确以及不能评价单个鉴定结果的可信度,经过TDA质量控制后的结果还需要进一步检验,因此领域内也提出了一系列其他方法 (本文统称为Beyond-TDA方法),协同加强肽段的可信度评价。本文对数据依赖模式下采集的质谱数据肽段层面的TDA常规方法和特殊方法进行了综述,对Beyond-TDA方法进行了分类阐述,并总结了各种方法的优势与不足。 展开更多
关键词 蛋白质组学 质谱分析 目标-诱饵库方法 假发现率 可信度评价方法
下载PDF
基于GWAS数据分析肠道菌群与脑出血的关系 被引量:1
19
作者 林迪慧 刘新鹏 +3 位作者 黎祺 秦家碧 熊震东 吴欣锐 《中南大学学报(医学版)》 CAS CSCD 北大核心 2023年第8期1176-1184,共9页
目的:自发性脑出血(intracerebral hemorrhage,ICH)在脑卒中各亚型中病死率、致残率最高,既往研究表明肠道菌群(gut microbiome,GM)与ICH的危险因素和病理基础密切相关。本研究旨在探索两者的因果关联及GM对ICH发病的潜在作用机制。方法... 目的:自发性脑出血(intracerebral hemorrhage,ICH)在脑卒中各亚型中病死率、致残率最高,既往研究表明肠道菌群(gut microbiome,GM)与ICH的危险因素和病理基础密切相关。本研究旨在探索两者的因果关联及GM对ICH发病的潜在作用机制。方法:从微生物基因组联盟及国际脑卒中协会获取有关GM和ICH的全基因组关联分析(genome wide association study,GWAS)数据,对GWAS数据使用孟德尔随机化(Mendelian randomization,MR)分析探讨GM与ICH的因果关联,运用条件错误发现率(conditional false discovery rate,cFDR)法识别两者的多效性易感遗传变异。结果:MR分析结果显示:Pasteurellales目、Pasteurellaceae科、Haemophilus属的GM与ICH有负向因果效应;Verrucomicrobiae纲、Verrucomicrobiales目、Verrucomicrobiaceae科、Akkermansia属、Holdemanella属和LachnospiraceaeUCG010属的GM与ICH有正向因果效应。通过cFDR法识别出GM与ICH的3个多效性遗传位点,分别为rs331083、rs4315115和rs12553325。结论:GM与ICH发病存在因果关联和多效性易感遗传变异。 展开更多
关键词 肠道菌群 脑出血 孟德尔随机化 条件错误发现率 全基因组关联分析
下载PDF
基于网络调整的多重假设检验方法及其在共同基金选择中的应用
20
作者 张军 兰伟 方能胜 《经济管理学刊》 2023年第4期119-142,共24页
共同基金选择是资产配置关注的重要问题之一。本文提出了基金网络下的共同基金选择模型,该模型将基金重仓持股的网络权重矩阵作为惩罚项引入参数估计中,能够限定彼此相连基金的业绩alpha(α)的差异。在此基础上,本文评估了基金网络对基... 共同基金选择是资产配置关注的重要问题之一。本文提出了基金网络下的共同基金选择模型,该模型将基金重仓持股的网络权重矩阵作为惩罚项引入参数估计中,能够限定彼此相连基金的业绩alpha(α)的差异。在此基础上,本文评估了基金网络对基金业绩的影响,并结合错误发现率(FDR)方法提出了基于网络调整的共同基金选择策略。实证采用中国2016年1月至2020年12月的596只共同基金数据样本进行分析,研究发现:①近5年中国基金的持股具有高度重合度,使得基金业绩之间存在较高的关联性;②基金网络与基金业绩之间存在“马太效应”,即基金网络对正α基金存在正向作用,而对负α基金存在负向作用;③通过与其他基金选择方法做对比,本文提出的基于网络调整的共同基金选择模型能够有效地剔除基金网络对基金业绩的影响,选出真正具有选股能力的基金。本文结果不仅可为基金间的共同持股行为提供新的解释,还可为投资者或Fund of Funds(FOF)基金经理的投资决策提供新的视角。 展开更多
关键词 基金网络 网络调整矩阵 错误发现率 共同基金选择
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部