期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Feature Screening for Ultrahigh-dimensional Censored Data with Varying Coefficient Single-index Model
1
作者 Yi LIU 《Acta Mathematicae Applicatae Sinica》 SCIE CSCD 2019年第4期845-861,共17页
In this paper, we study the sure independence screening of ultrahigh-dimensional censored data with varying coefficient single-index model. This general model framework covers a large number of commonly used survival ... In this paper, we study the sure independence screening of ultrahigh-dimensional censored data with varying coefficient single-index model. This general model framework covers a large number of commonly used survival models. The property that the proposed method is not derived for a specific model is appealing in ultrahigh dimensional regressions, as it is difficult to specify a correct model for ultrahigh dimensional predictors.Once the assuming data generating process does not meet the actual one, the screening method based on the model will be problematic. We establish the sure screening property and consistency in ranking property of the proposed method. Simulations are conducted to study the finite sample performances, and the results demonstrate that the proposed method is competitive compared with the existing methods. We also illustrate the results via the analysis of data from The National Alzheimers Coordinating Center(NACC). 展开更多
关键词 censored data consistency in ranking PROPERTY FEATURE selection HIGH-dimensional data sure SCREENING PROPERTY VARYING COEFFICIENT single-index model
原文传递
Model-free feature screening for high-dimensional survival data 被引量:2
2
作者 Yuanyuan Lin Xianhui Liu Meiling Hao 《Science China Mathematics》 SCIE CSCD 2018年第9期1617-1636,共20页
With the rapid-growth-in-size scientific data in various disciplines, feature screening plays an important role to reduce the high-dimensionality to a moderate scale in many scientific fields. In this paper, we introd... With the rapid-growth-in-size scientific data in various disciplines, feature screening plays an important role to reduce the high-dimensionality to a moderate scale in many scientific fields. In this paper, we introduce a unified and robust model-free feature screening approach for high-dimensional survival data with censoring, which has several advantages: it is a model-free approach under a general model framework, and hence avoids the complication to specify an actual model form with huge number of candidate variables; under mild conditions without requiring the existence of any moment of the response, it enjoys the ranking consistency and sure screening properties in ultra-high dimension. In particular, we impose a conditional independence assumption of the response and the censoring variable given each covariate, instead of assuming the censoring variable is independent of the response and the covariates. Moreover, we also propose a more robust variant to the new procedure, which possesses desirable theoretical properties without any finite moment condition of the predictors and the response. The computation of the newly proposed methods does not require any complicated numerical optimization and it is fast and easy to implement. Extensive numerical studies demonstrate that the proposed methods perform competitively for various configurations. Application is illustrated with an analysis of a genetic data set. 展开更多
关键词 feature screening random censoring robustness sure independence screening ultra-high dimension
原文传递
基于高维删失数据的分布式惩罚平均经验欧氏似然
3
作者 朱彦霖 于海生 《德州学院学报》 2023年第6期15-22,共8页
提出了一种基于高维删失数据的分布式惩罚平均经验欧氏似然方法(DPMEEL)。解决了经验似然在数据量较大时容易出现结果异常的问题,并且通过引入分布式估计的思想,大大提高了计算效率。通过研究表明,在某些条件下,分布式惩罚平均经验欧氏... 提出了一种基于高维删失数据的分布式惩罚平均经验欧氏似然方法(DPMEEL)。解决了经验似然在数据量较大时容易出现结果异常的问题,并且通过引入分布式估计的思想,大大提高了计算效率。通过研究表明,在某些条件下,分布式惩罚平均经验欧氏似然具有Oracle特性、渐进正态性,且其似然比的检验统计量服从卡方分布。模拟研究和实例分析说明了分布式惩罚平均经验欧氏似然具有较好的表现。 展开更多
关键词 经验欧氏似然 高维 惩罚似然 删失数据 分布式估计
下载PDF
基于分位数方法的超高维删失数据的特征筛选 被引量:3
4
作者 田镇滔 张军舰 《广西师范大学学报(自然科学版)》 CAS 北大核心 2021年第6期99-111,共13页
利用条件分位数分别在响应变量非随机删失和随机删失的情形下研究超高维数据的特征筛选,提出相应的特征筛选方法,理论证明和模拟验证都证明该方法筛选出的变量集满足确定筛选性质和排序一致性。与已有方法相比,本文方法在协变量与删失... 利用条件分位数分别在响应变量非随机删失和随机删失的情形下研究超高维数据的特征筛选,提出相应的特征筛选方法,理论证明和模拟验证都证明该方法筛选出的变量集满足确定筛选性质和排序一致性。与已有方法相比,本文方法在协变量与删失变量相关时具有相对优势。 展开更多
关键词 超高维删失数据 特征筛选 条件分位数
下载PDF
Sure feature screening for high-dimensional dichotomous classification 被引量:2
5
作者 SHAO Li YU Yuan ZHOU Yong 《Science China Mathematics》 SCIE CSCD 2016年第12期2527-2542,共16页
The curse of high-dimensionality has emerged in the statistical fields more and more frequently.Many techniques have been developed to address this challenge for classification problems. We propose a novel feature scr... The curse of high-dimensionality has emerged in the statistical fields more and more frequently.Many techniques have been developed to address this challenge for classification problems. We propose a novel feature screening procedure for dichotomous response data. This new method can be implemented as easily as t-test marginal screening approach, and the proposed procedure is free of any subexponential tail probability conditions and moment requirement and not restricted in a specific model structure. We prove that our method possesses the sure screening property and also illustrate the effect of screening by Monte Carlo simulation and apply it to a real data example. 展开更多
关键词 ultra-high dimensional data dichotomous classification sure screening property
原文传递
对参数带约束条件的生存模型的回归分析
6
作者 邓立凤 韦程东 《数学建模及其应用》 2019年第2期1-10,共10页
为了降低成本、提高研究效率,对与时间相依的数据,有偏抽样方法是广泛应用的基础抽样方法.在建模过程中,它可以从参数的先验信息中提取更有价值的信息.随着数字信息的发展,在许多领域都可以收集到协变量维数大于样本容量的高维数据.变... 为了降低成本、提高研究效率,对与时间相依的数据,有偏抽样方法是广泛应用的基础抽样方法.在建模过程中,它可以从参数的先验信息中提取更有价值的信息.随着数字信息的发展,在许多领域都可以收集到协变量维数大于样本容量的高维数据.变量选择法和独立筛选法是非常有效的降维方法.在比例风险模型中,对参数带有约束条件的回归分析,采用了修正的MM算法,但对不同的模型,此优化算法不再适用.为了克服优化问题的计算复杂难实现的困难,将蚁群算法和粒子群算法等优化算法应用到参数带约束条件的回归分析中. 展开更多
关键词 删失数据 高维协变量 带约束条件的估计 生存模型 优化算法
下载PDF
超高维删失数据的联合特征筛选方法研究 被引量:3
7
作者 潘婧 柴洪峰 +1 位作者 孙权 周勇 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2023年第1期169-190,共22页
针对超高维删失数据,通过降维技术可以进行特征选取,去除大数据中的噪声数据,以便挖掘高维大数据的重要信息,进行大数据的相关分析和应用.本文提出了一种稳健的偏相关系数来进行特征筛选,并引入逆概率加权方法来处理删失,发展出一种新... 针对超高维删失数据,通过降维技术可以进行特征选取,去除大数据中的噪声数据,以便挖掘高维大数据的重要信息,进行大数据的相关分析和应用.本文提出了一种稳健的偏相关系数来进行特征筛选,并引入逆概率加权方法来处理删失,发展出一种新的联合特征筛选方法.本文利用响应变量的条件分布函数来构造偏相关性度量,可以全面地刻画其与协变量间的相关性,且相较于传统的皮尔逊偏相关系数,该度量对于响应存在异常值,厚尾分布以及异方差结构时具有稳健性.其次,基于该度量所提出的联合特征筛选方法通过投影作用来消除由协变量之间的相关关系产生的干扰作用,故能够较好地改善假阴性错误、假阳性错误及协变量的共线性问题.我们推导了该方法的理论性质,给出了快速的迭代算法,并进一步通过模拟和实例分析来考察该算法在有限样本下的数值表现. 展开更多
关键词 超高维删失数据 特征筛选 偏相关系数 逆概率加权估计 稳健性
原文传递
超高维Ⅱ型区间删失数据的非参数变量筛选法 被引量:2
8
作者 张婧 靳韶佳 陈丹丹 《应用数学学报》 CSCD 北大核心 2021年第5期690-702,共13页
在定期随访的医学研究或临床实验中,人们经常会收集到高维区间删失数据,如何对这类数据进行降维是一个非常有意义的问题.本文基于Kolmogorov-Smirnov检验统计量,利用分割和融合的技巧,把独立特征筛选方法推广到区间删失数据中,提出了一... 在定期随访的医学研究或临床实验中,人们经常会收集到高维区间删失数据,如何对这类数据进行降维是一个非常有意义的问题.本文基于Kolmogorov-Smirnov检验统计量,利用分割和融合的技巧,把独立特征筛选方法推广到区间删失数据中,提出了一种可以处理超高维Ⅱ型区间删失数据且不依赖于任何模型假设的变量筛选方法.此方法的适用范围很广,可以有效地处理各种生存模型下的超高维Ⅱ型区间删失数据,而且可以处理离散型,连续型等多种类型的协变量.在估计生存函数时,本文采用EM-ICM算法,极大地提高了计算效率.大量的数值模拟实验验证了此方法在有限样本下的有效性. 展开更多
关键词 区间删失数据 超高维数据 变量筛选 EM-ICM算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部