期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
面板数据的可加分位回归模型研究与应用 被引量:2
1
作者 罗幼喜 张敏 田茂再 《统计研究》 CSSCI 北大核心 2020年第2期105-118,共14页
本文在贝叶斯分析的框架下讨论了面板数据的可加模型分位回归建模方法。首先通过低秩薄板惩罚样条展开和个体效应虚拟变量的引进将非参数模型转换为参数模型,然后在假定随机误差项服从非对称Laplace分布的基础上建立了贝叶斯分层分位回... 本文在贝叶斯分析的框架下讨论了面板数据的可加模型分位回归建模方法。首先通过低秩薄板惩罚样条展开和个体效应虚拟变量的引进将非参数模型转换为参数模型,然后在假定随机误差项服从非对称Laplace分布的基础上建立了贝叶斯分层分位回归模型。通过对非对称Laplace分布的分解,论文给出了所有待估参数的条件后验分布,并构造了待估参数的Gibbs抽样估计算法。计算机模拟仿真结果显示,新提出的方法相比于传统的可加模型均值回归方法在估计稳健性上明显占优。最后以消费支出面板数据为例研究了我国农村居民收入结构对消费支出的影响,发现对于农村居民来说,无论是高、中、低消费群体,工资性收入与经营净收入的增加对其消费支出的正向刺激作用更为明显。进一步,相比于高消费农村居民人群,低消费农村居民人群随着收入的增加消费支出上升速度较为缓慢。 展开更多
关键词 可加模型 惩罚样条 非参数分位回归 马尔科夫蒙特卡罗算法
下载PDF
缺失数据下的逆概率多重加权分位回归估计及其应用 被引量:7
2
作者 邰凌楠 王春雨 田茂再 《统计研究》 CSSCI 北大核心 2018年第9期115-128,共14页
数据缺失问题普遍存在于应用研究中。在随机缺失机制假定下,本文从模型推断角度出发,针对线性缺失分位回归模型,提出一种新的有效估计方法——逆概率多重加权(IPMW)估计。该方法是在逆概率加权(IPW)估计的基础上,结合倾向得分匹配及模... 数据缺失问题普遍存在于应用研究中。在随机缺失机制假定下,本文从模型推断角度出发,针对线性缺失分位回归模型,提出一种新的有效估计方法——逆概率多重加权(IPMW)估计。该方法是在逆概率加权(IPW)估计的基础上,结合倾向得分匹配及模型平均思想,经过多次估计,加权确定最终参数估计结果。该方法适用于响应变量是独立同分布或独立非同分布的情形,并适用于绝大多数数据缺失场景。经过理论推导及模拟研究发现,IPMW估计量在继承IPW估计量的优势上具有更稳健的性质。最后,将该方法应用于含有缺失数据的微观调查数据中,研究了经济较发达的准一线城市中等收入群体消费水平的影响因素,对比两种估计方法的估计结果,发现逆概率多重加权估计量的标准偏差更小,估计结果更稳健。 展开更多
关键词 线性分位回归 倾向得分 逆概率多重加权 随机缺失机制 模型平均
下载PDF
零膨胀计数数据函数型部分变系数模型 被引量:1
3
作者 王芝皓 刘艳霞 +1 位作者 田茂再 陈小昆 《统计研究》 CSSCI 北大核心 2021年第7期127-139,共13页
在实际数据分析中经常会遇到零膨胀计数数据作为响应变量与函数型随机变量和随机向量作为预测变量相关联。本文考虑函数型部分变系数零膨胀模型(FPVCZIM),模型中无穷维的斜率函数用函数型主成分基逼近,系数函数用B-样条进行拟合。通过E... 在实际数据分析中经常会遇到零膨胀计数数据作为响应变量与函数型随机变量和随机向量作为预测变量相关联。本文考虑函数型部分变系数零膨胀模型(FPVCZIM),模型中无穷维的斜率函数用函数型主成分基逼近,系数函数用B-样条进行拟合。通过EM算法得到估计量,讨论其理论性质,在一些正则条件下获得了斜率函数和系数函数估计量的收敛速度。有限样本的Monte Carlo模拟研究和真实数据分析被用来解释本文提出的方法。 展开更多
关键词 函数型数据分析 变系数零膨胀模型 函数型零膨胀模型 B-样条 Karhunen-Loève表示
下载PDF
基于Bootstrap方法的多维统计数据质量评估 被引量:6
4
作者 白永昕 闫懋博 +1 位作者 田茂再 翟宏伟 《统计与决策》 CSSCI 北大核心 2020年第11期5-9,共5页
如何从混杂的数据中获取真正有价值的数据,保证数据质量成为亟待解决的问题。文章首先从数据系统偏差、安全性以及非随机性方面讨论了新时代统计数据质量评估所面临的挑战。在统计数据质量评估现状研究的基础上,将Bootstrap方法引入多... 如何从混杂的数据中获取真正有价值的数据,保证数据质量成为亟待解决的问题。文章首先从数据系统偏差、安全性以及非随机性方面讨论了新时代统计数据质量评估所面临的挑战。在统计数据质量评估现状研究的基础上,将Bootstrap方法引入多维统计数据质量的评估中,并给出了多维统计数据质量的一般框架。根据国家统计局公布的相关数据进行了模拟和验证。 展开更多
关键词 数据质量评估 统计分布检验 BOOTSTRAP
下载PDF
零膨胀计数数据的联合建模及变量选择 被引量:5
5
作者 胡亚南 田茂再 《统计研究》 CSSCI 北大核心 2019年第1期104-114,共11页
零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术,研究了零膨胀计数数据的联合建模及变量选择问题。对于零膨胀泊... 零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术,研究了零膨胀计数数据的联合建模及变量选择问题。对于零膨胀泊松分布,引入潜变量,构造出零膨胀泊松模型的完全似然,由零膨胀部分和泊松部分两项组成。考虑到协变量可能存在共线性和稀疏性,通过对似然函数加自适应弹性网惩罚得到目标函数,然后利用EM算法得到回归系数的稀疏估计量,并用贝叶斯信息准则BIC来确定最优调节参数。本文也给出了估计量的大样本性质的理论证明和模拟研究,最后把所提出的方法应用到实际问题中。 展开更多
关键词 零膨胀泊松模型 变量选择 联合建模
下载PDF
函数型变量倾斜分位回归模型及其应用 被引量:3
6
作者 田茂再 梅波 《统计研究》 CSSCI 北大核心 2019年第8期114-128,共15页
本文考虑函数型数据的结构特征,针对两类函数型变量分位回归模型(函数型因变量对标量自变量和函数型因变量对函数型自变量),基于函数型倾斜分位曲线的定义构建新型函数型倾斜分位回归模型。对于第二类模型,本文分别考虑样条基函数对模... 本文考虑函数型数据的结构特征,针对两类函数型变量分位回归模型(函数型因变量对标量自变量和函数型因变量对函数型自变量),基于函数型倾斜分位曲线的定义构建新型函数型倾斜分位回归模型。对于第二类模型,本文分别考虑样条基函数对模型系数展开和函数型主成分基函数对函数型自变量展开,得到倾斜分位回归模型的基本形式。参数估计采用成分梯度Boosting算法最小化加权非对称损失函数,提高计算效率。在理论上证明了倾斜分位回归模型的系数估计量均服从渐近正态分布。模拟和实证研究结果显示,倾斜分位回归模型比已有的逐点分位回归模型具有更好的拟合效果。根据积分均方预测误差准则,本文提出的模型有一致较好的预测能力。 展开更多
关键词 函数型数据 函数型主成分 倾斜分位回归 积分均分预测误差 渐近分布 多发性硬化症
下载PDF
大数据下张量充分降维方法及其应用研究 被引量:3
7
作者 马少沛 孙庆慧 +1 位作者 武雅萱 田茂再 《统计研究》 CSSCI 北大核心 2021年第2期114-134,共21页
在大数据时代,金融学、基因组学和图像处理等领域产生了大量的张量数据。Zhong等(2015)提出了张量充分降维方法,并给出了处理二阶张量的序列迭代算法。鉴于高阶张量在实际生活中的广泛应用,本文将Zhong等(2015)的算法推广到高阶,以三阶... 在大数据时代,金融学、基因组学和图像处理等领域产生了大量的张量数据。Zhong等(2015)提出了张量充分降维方法,并给出了处理二阶张量的序列迭代算法。鉴于高阶张量在实际生活中的广泛应用,本文将Zhong等(2015)的算法推广到高阶,以三阶张量为例,提出了两种不同的算法:结构转换算法和结构保持算法。两种算法都能够在不同程度上保持张量原有结构信息,同时有效降低变量维度和计算复杂度,避免协方差矩阵奇异的问题。将两种算法应用于人像彩图的分类识别,以二维和三维点图等形式直观展现了算法分类结果。将本文的结构保持算法与K-means聚类方法、t-SNE非线性降维方法、多维主成分分析、多维判别分析和张量切片逆回归共五种方法进行对比,结果表明本文所提方法在分类精度方面有明显优势,因此在图像识别及相关应用领域具有广阔的发展前景。 展开更多
关键词 张量 充分降维 迭代算法 图像识别
下载PDF
异质性大数据的分布式估计 被引量:2
8
作者 郭婧璇 徐慧超 +1 位作者 祝婉晴 田茂再 《统计研究》 CSSCI 北大核心 2020年第10期104-114,共11页
随着物联网技术的进步,大数据给网络带宽和计算机存储能力带来巨大挑战,传统的集中式数据处理难以实现,客观上促进了分布式统计学习的发展。在无迭代算法研究中,Zhang等(2013)证明了当数据集个数s=O(■)时,基于局部经验风险最小化的分治... 随着物联网技术的进步,大数据给网络带宽和计算机存储能力带来巨大挑战,传统的集中式数据处理难以实现,客观上促进了分布式统计学习的发展。在无迭代算法研究中,Zhang等(2013)证明了当数据集个数s=O(■)时,基于局部经验风险最小化的分治(DC)简单平均估计量具有O(N-1)均方误差收敛速度,Huang和Huo(2019)在M估计框架下进一步提出分布式一步估计量,但上述方法均未考虑海量数据可能存在的异质性对分治估计效果的影响。本文在线性模型框架下提出海量异质数据的分治一步加权估计,证明了估计量的渐近性质并考虑了异质性检验问题。将本文提出的方法应用于美国医疗保险实际数据分析,结果表明该方法能更好地拟合数据的线性趋势且显著提高了计算效率。 展开更多
关键词 分治策略 一步估计 海量数据 异质性 医疗保险
下载PDF
样本选择参数分位回归模型及其在工资分布分解中的应用
9
作者 邰凌楠 钱曼玲 田茂再 《统计研究》 CSSCI 北大核心 2020年第1期62-73,共12页
在工资差距分解问题中,研究者经常会遇到样本选择偏差问题,直接忽略会导致最终估计结果产生严重偏差,同时在众多工资差距分解方法中,相比于均值分解,分布分解方法更受研究者青睐。针对参数分位回归,本文首次提出可加形式与非可加形式的... 在工资差距分解问题中,研究者经常会遇到样本选择偏差问题,直接忽略会导致最终估计结果产生严重偏差,同时在众多工资差距分解方法中,相比于均值分解,分布分解方法更受研究者青睐。针对参数分位回归,本文首次提出可加形式与非可加形式的样本选择参数分位回归(SSPQR)模型,并基于这两类样本选择参数分位回归模型给出修正样本选择偏差后的参数分位回归工资差距分布分解方法。运用上述方法及已有的工资分布分解方法,借助CHNS2015年度城镇数据,本文研究了我国城镇男女工资差距及差距分解问题,得出以下结论:①男女工资差距主要来源是性别歧视问题;②经过样本选择偏差修正后,实际的工资差距更大,歧视问题更严重;③男女工资差距程度在不同分位点上结果不同,换句话说,我们不能简单地仅从平均水平来判断工资差距程度;④与其他已有方法计算结果比较发现,SSPQR计算的工资差距程度更大。 展开更多
关键词 样本选择偏差 参数分位回归 工资差距 分布分解
下载PDF
稀疏非线性函数型可加模型的变量选择
10
作者 白永昕 田茂再 《统计研究》 CSSCI 北大核心 2021年第5期109-120,共12页
本文研究了响应变量和协变量均为函数型数据的非线性可加模型的变量选择问题。首先,基于函数型距离相关系数,本文构造了一个F检验统计量。对协变量和残差的函数型距离相关系数进行排序并对最大相关系数所对应的协变量与残差进行独立性F... 本文研究了响应变量和协变量均为函数型数据的非线性可加模型的变量选择问题。首先,基于函数型距离相关系数,本文构造了一个F检验统计量。对协变量和残差的函数型距离相关系数进行排序并对最大相关系数所对应的协变量与残差进行独立性F检验,选择满足条件的新变量纳入到模型。其次,对每个新变量纳入模型后的贡献进行评估,从而确认新变量最终是否应该纳入模型。这种变量选择方法通过不依赖模型的方法选择候选变量,将变量选择和模型估计分开,可以降低回归中协变量的维度。同时,在迭代过程中利用残差可以获取模型的相关信息,从而提高变量选择的准确度。最后,本文通过模拟研究对所提变量选择方法的表现进行评价,并进一步通过一个家电能耗数据来验证所提的方法。 展开更多
关键词 函数型响应变量 非线性可加模型 变量选择
下载PDF
基于Logistic回归模型的APP任务定价应用研究
11
作者 刘娱 田茂再 《中国物价》 2020年第8期98-101,共4页
本文利用“拍照赚钱”APP发布的任务数据,以提高劳务成功率为目标,根据任务完成情况对任务进行“捆绑”处理。首先对任务价格采用K-means进行地区分类,随后针对任务完成情况为0-1的分类数据采用Logistic回归模型作为预测模型,得出以下结... 本文利用“拍照赚钱”APP发布的任务数据,以提高劳务成功率为目标,根据任务完成情况对任务进行“捆绑”处理。首先对任务价格采用K-means进行地区分类,随后针对任务完成情况为0-1的分类数据采用Logistic回归模型作为预测模型,得出以下结论:在保持任务完成率高的同时,商家可降低价格以节约成本;而在完成情况较差的地区应提高任务定价,以提升任务完成效率。文章最后对此类新兴产业发展提出几项对策建议,以完善产业管理,推进企业进步。 展开更多
关键词 LOGISTIC回归 K-means分类 任务定价 产业发展
下载PDF
广义逐步混合删失方案下逆威布尔分布的参数推断
12
作者 张丽平 田茂再 田玉柱 《系统科学与数学》 CSCD 北大核心 2023年第12期3339-3360,共22页
逆威布尔分布和广义逐步混合删失方案在可靠性领域中有着广泛的应用,广义逐步混合删失方案能够保证在寿命检测周期内观测到一定数量的失效样本,提高统计推断的效率.因此,文章在该删失方案下从频率学派和贝叶斯学派两个角度讨论了逆威布... 逆威布尔分布和广义逐步混合删失方案在可靠性领域中有着广泛的应用,广义逐步混合删失方案能够保证在寿命检测周期内观测到一定数量的失效样本,提高统计推断的效率.因此,文章在该删失方案下从频率学派和贝叶斯学派两个角度讨论了逆威布尔分布的参数推断问题.对于经典频率学方法,文章证明了在此删失方案下两未知参数极大似然估计存在的唯一性,并给出了相应的渐近置信区间,同时,利用EM算法进行点估计,Bootstrap法进行区间估计.对于贝叶斯方法,文章基于伽马先验,利用Metropolis-Hastings算法对两未知参数进行点估计和可信区间估计.最后通过大量的Monte Carlo模拟实验和一组实际数据分析,展示所提出方法的效果. 展开更多
关键词 逆威布尔分布 广义逐步混合删失 参数估计 EM算法
原文传递
基于新扩展Weibull分布的参数估计及应用
13
作者 程月 田茂再 谷亚停 《山东理工大学学报(自然科学版)》 CAS 2024年第6期65-71,78,共8页
Weibull分布是Arccosine-X分布族的一个特例,本文提出一种新的具有两参数的Arccosine-Weibull(AC-W)分布。研究了AC-W分布的基本统计性质,使用频率学派的最大似然估计(MLE)方法讨论了AC-W分布的参数估计,并通过蒙特卡罗模拟分析来评估... Weibull分布是Arccosine-X分布族的一个特例,本文提出一种新的具有两参数的Arccosine-Weibull(AC-W)分布。研究了AC-W分布的基本统计性质,使用频率学派的最大似然估计(MLE)方法讨论了AC-W分布的参数估计,并通过蒙特卡罗模拟分析来评估所获得估计量的效率,最后选取一组真实的洪峰数据集,将AC-W与其他竞争分布进行比较。采用AIC、BIC、CAIC和HQIC等信息准则评估AC-W分布在拟合数据方面相较于竞争分布的优越性,证明了AC-W分布的有效性和灵活性。 展开更多
关键词 Arccosine-Weibull分布 极大似然估计 模拟分析
下载PDF
基于偏最小二乘路径模型的分位效应测度 被引量:3
14
作者 王芝皓 田茂再 侯震梅 《系统科学与数学》 CSCD 北大核心 2020年第4期738-750,共13页
对于偏最小二乘路径模型的效应分析,为了测度路径模型的分位效应,文章首先给出了偏最小二乘路径模型建模的具体过程.其次,基于潜变量得分与分位回归提出估计平滑分位效应的方法,给出了平滑分位效应的Bootstrap置信带的算法.最后,考虑顾... 对于偏最小二乘路径模型的效应分析,为了测度路径模型的分位效应,文章首先给出了偏最小二乘路径模型建模的具体过程.其次,基于潜变量得分与分位回归提出估计平滑分位效应的方法,给出了平滑分位效应的Bootstrap置信带的算法.最后,考虑顾客满意度的分位异质性,对满意度模型的分位效应进行分析.结论表明,该方法是对传统偏最小二乘路径模型的一种补充且可获得更有深度的决策信息. 展开更多
关键词 偏最小二乘路径模型 潜变量得分 分位异质性 分位回归 分位效应
原文传递
Robust estimation in inverse problems via quantile coupling 被引量:2
15
作者 tian maozai 《Science China Mathematics》 SCIE 2012年第5期1029-1041,共13页
In this article we consider a sequence of hierarchical space model of inverse problems.The underlying function is estimated from indirect observations over a variety of error distributions including those that are hea... In this article we consider a sequence of hierarchical space model of inverse problems.The underlying function is estimated from indirect observations over a variety of error distributions including those that are heavy-tailed and may not even possess variances or means.The main contribution of this paper is that we establish some oracle inequalities for the inverse problems by using quantile coupling technique that gives a tight bound for the quantile coupling between an arbitrary sample p-quantile and a normal variable,and an automatic selection principle for the nonrandom filters.This leads to the data-driven choice of weights.We also give an algorithm for its implementation.The quantile coupling inequality developed in this paper is of independent interest,because it includes the median coupling inequality in literature as a special case. 展开更多
关键词 耦合技术 中位数 反问题 鲁棒估计 空间模型 误差分布 函数估计 变量耦合
原文传递
Adaptive quantile regression with precise risk bounds 被引量:1
16
作者 tian maozai CHAN Ngai Hang 《Science China Mathematics》 SCIE CSCD 2017年第5期875-896,共22页
An adaptive local smoothing method for nonparametric conditional quantile regression models is considered in this paper. Theoretical properties of the procedure are examined. The proposed method is fully adaptive in t... An adaptive local smoothing method for nonparametric conditional quantile regression models is considered in this paper. Theoretical properties of the procedure are examined. The proposed method is fully adaptive in the sense that no prior information about the structure of the model is assumed. The fully adaptive feature not only allows varying bandwidths to accommodate jumps or instantaneous slope changes, but also allows the algorithm to be spatially adaptive. Under general conditions, precise risk bounds for homogeneous and heterogeneous cases of the underlying conditional quantile curves are established. An automatic selection algorithm for locally adaptive bandwidths is also given, which is applicable to higher dimensional cases. Simulation studies and data analysis confirm that the proposed methodology works well. 展开更多
关键词 空间自适应 分位数回归 风险 条件分位数 自适应带宽 回归模型 选择算法 平滑方法
原文传递
Heteroscedasticity Detection and Estimation with Quantile Difference Method
17
作者 XIA Wentao XIONG Wei tian maozai 《Journal of Systems Science & Complexity》 SCIE EI CSCD 2016年第2期511-530,共20页
When dealing with regression analysis,heteroscedasticity is a problem that the authors have to face with.Especially if little information can be got in advance,detection of heteroscedasticity as well as estimation of ... When dealing with regression analysis,heteroscedasticity is a problem that the authors have to face with.Especially if little information can be got in advance,detection of heteroscedasticity as well as estimation of statistical models could be even more difficult.To this end,this paper proposes a quantile difference method(QDM) that can effectively estimate the heteroscedastic function.This method,being completely free from the estimation of mean regression function,is simple,robust and easy to implement.Moreover,the QDM method enables the detection of heteroscedasticity without any restrictions on error terms,consequently being widely applied.What is worth mentioning is that based on the proposed approach estimators of both mean regression function and heteroscedastic function can be obtained.In the end,the authors conduct some simulations to examine the performance of the proposed methods and use a real data to make an illustration. 展开更多
关键词 估计方法 异方差 分位数 检测 统计模型 方差函数 回归函数 回归分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部