期刊文献+
共找到223篇文章
< 1 2 12 >
每页显示 20 50 100
非概率抽样估计中先验信息的利用——基于贝叶斯模型估计视角
1
作者 郝一炜 刘晓宇 金勇进 《调研世界》 2024年第5期86-96,共11页
非概率样本的估计问题是近年来的研究热点,本文以调查中先验信息的利用作为切入点,在配额抽样下设置贝叶斯形式的超总体模型,使用样本信息与先验信息对总体目标变量进行加权估计,从而解决非概率样本的估计问题。通过对北京市医疗资源调... 非概率样本的估计问题是近年来的研究热点,本文以调查中先验信息的利用作为切入点,在配额抽样下设置贝叶斯形式的超总体模型,使用样本信息与先验信息对总体目标变量进行加权估计,从而解决非概率样本的估计问题。通过对北京市医疗资源调查的实证研究,表明先验信息的准确性和权重的合理分配决定着贝叶斯估计的效果,在合理的模型设置下贝叶斯估计在大量重复抽样下具有更好的稳定性。 展开更多
关键词 配额抽样 概率抽样 先验信息 基于贝叶斯模型估计
下载PDF
基于单元间距离估计的不等概率抽样算法及应用 被引量:2
2
作者 周楷贺 李莉莉 《青岛大学学报(自然科学版)》 CAS 2023年第2期5-10,共6页
现有大数据的不等概率抽样方法大多基于数据分布,泛化能力较差。为此,利用多层感知机、XGBoost和Kriging模型估计总体单元间的相对距离,提出针对海量数据的不等概率抽样算法。此类算法既不需要考虑总体的分布,又能够保证样本的代表性。... 现有大数据的不等概率抽样方法大多基于数据分布,泛化能力较差。为此,利用多层感知机、XGBoost和Kriging模型估计总体单元间的相对距离,提出针对海量数据的不等概率抽样算法。此类算法既不需要考虑总体的分布,又能够保证样本的代表性。实证分析结果表明,基于此算法抽取样本构建的模型与简单随机抽样方法相比,模型参数估计的均方误差更低,效果更稳定。 展开更多
关键词 不等概率抽样 代理模型 样本代表性
下载PDF
大数据背景下非概率抽样的统计推断问题 被引量:31
3
作者 金勇进 刘展 《统计研究》 CSSCI 北大核心 2016年第3期11-17,共7页
利用大数据进行抽样,很多情况下由于抽样框的构造比较困难,使得抽取的样本属于非概率样本,传统的抽样推断理论难以应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率... 利用大数据进行抽样,很多情况下由于抽样框的构造比较困难,使得抽取的样本属于非概率样本,传统的抽样推断理论难以应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率抽样统计推断问题的基本思路:一是抽样方法,可以考虑基于样本匹配的样本选择、链接跟踪抽样方法等,使得到的非概率样本近似于概率样本,从而可采用概率样本的统计推断理论;二是权数的构造与调整,可以考虑基于伪设计、模型和倾向得分等方法得到类似于概率样本的基础权数;三是估计,可以考虑基于伪设计、模型和贝叶斯的混合概率估计。最后,本文以基于样本匹配的样本选择为例探讨了具体解决方法。 展开更多
关键词 大数据 概率抽样 统计推断
下载PDF
不等概率抽样估计的原理与应用 被引量:13
4
作者 李培军 《辽宁师范大学学报(自然科学版)》 CAS 2004年第4期385-388,共4页
不等概率抽样估计是一种十分有效的抽样推断方法.它在以样本估计总体时是应用一个与所要调查的目标变量相关的辅助变量作为样本单位抽选的概率,能使得对总体指标数值影响大的单位赋予大的抽中概率,同时在构造样本指标时,可利用辅助变量... 不等概率抽样估计是一种十分有效的抽样推断方法.它在以样本估计总体时是应用一个与所要调查的目标变量相关的辅助变量作为样本单位抽选的概率,能使得对总体指标数值影响大的单位赋予大的抽中概率,同时在构造样本指标时,可利用辅助变量值对目标变量值进行调整,增大了样本对总体的代表性,由此抽取的样本和依据样本计算的样本指标就更接近于总体指标. 展开更多
关键词 不等概率抽样 辅助变量 估计 样本 总体 抽样推断 单位 目标变量 指标 量值
下载PDF
严格πps抽样方案在不放回不等概率抽样方案中的可容许性 被引量:3
5
作者 阎在在 聂赞坎 《数学物理学报(A辑)》 CSCD 北大核心 2002年第4期489-493,共5页
该文在 R.R.Saxena等提出的一种易于实施的不等概率不放回抽样方案中讨论严格πps抽样方案的可容许性问题 .除了一种情形我们是在基于模型 -设计下讨论的外 。
关键词 不等概率抽样 πps抽样 可容许性 超总体模型
下载PDF
语料库建设中概率抽样方法的应用 被引量:4
6
作者 李德俊 曹军 《外语研究》 2001年第2期59-60,共2页
本文简要论述了建立小型语料库的作用和可行性 ,讨论了科学抽样方法的设计和应用 。
关键词 语料库 概率抽样 样本 分层抽样 等距抽样 随机抽样
下载PDF
多变量与规模成比例概率抽样的有关问题 被引量:2
7
作者 金勇进 栾文英 《统计与信息论坛》 2004年第1期5-8,共4页
多变量与规模成比例概率抽样技术是永久随机数抽样技术与Poisson抽样技术的结合与发展。文章讨论了多变量与规模成比例概率抽样的基本原理,并对其实用价值进行述评,希望能促进该抽样技术在调查工作中的应用。
关键词 永久随机数法 Poisson抽样 多变量与规模成比例概率抽样
下载PDF
不等概率抽样若干问题探讨 被引量:2
8
作者 李金昌 《统计研究》 CSSCI 北大核心 1999年第S1期139-141,共3页
随着抽样调查在我国应用领域的不断扩展,不等概率抽样方法的应用也将越来越普遍。本文拟就其有关问题作一探讨。一、不等概率抽样的估计量及其方差不等概率抽样是指当总体中的个体有大小差异、而所要调查的标志又与其有密切的正相关关... 随着抽样调查在我国应用领域的不断扩展,不等概率抽样方法的应用也将越来越普遍。本文拟就其有关问题作一探讨。一、不等概率抽样的估计量及其方差不等概率抽样是指当总体中的个体有大小差异、而所要调查的标志又与其有密切的正相关关系时,按个体大小赋予不同的被抽中概... 展开更多
关键词 不等概率抽样 估计量 辅助标志 概率分布 总体总量 若干问题 调查标志 抽样问题 不重复抽样 正相关关系
下载PDF
大数据下非概率抽样方法的应用思考 被引量:8
9
作者 米子川 聂瑞华 《统计与管理》 2016年第4期11-12,共2页
大数据时代对于数据的搜集提出了更高的要求,在现有存储计算能力还难以满足处理全数据的需求时,抽样调查依然有其存在的价值。非概率抽样作为重要的抽样方法,关于其如何适应大数据特点讨论有一定现实意义。本文首先介绍了已有的非概率... 大数据时代对于数据的搜集提出了更高的要求,在现有存储计算能力还难以满足处理全数据的需求时,抽样调查依然有其存在的价值。非概率抽样作为重要的抽样方法,关于其如何适应大数据特点讨论有一定现实意义。本文首先介绍了已有的非概率抽样方法,并提出互联网是大数据产生和存储的重要载体。在结合已有各类非概率抽样方法和互联网数据产生特点的基础上,该文给出了在面对互联网大数据时,如何继续使用非概率方法的讨论。 展开更多
关键词 概率抽样 大数据 互联网
下载PDF
论统计指数的概率抽样问题——兼与孙慧钧同志商榷 被引量:1
10
作者 周恒彤 《统计研究》 CSSCI 北大核心 1993年第6期60-62,共3页
近年来,我国的社会经济统计学工作者努力把数理统计学的理论与方法应用于解决社会经济统计学的各种研究课题,在这方面取得了许多有价值的成果。但也还有一些值得进一步探讨的问题。其中之一是,数理统计学有其特定的研究对象和研究任务... 近年来,我国的社会经济统计学工作者努力把数理统计学的理论与方法应用于解决社会经济统计学的各种研究课题,在这方面取得了许多有价值的成果。但也还有一些值得进一步探讨的问题。其中之一是,数理统计学有其特定的研究对象和研究任务。社会经济统计学中的课题,有的属于这种研究范畴,有的则不属于。对于前者。 展开更多
关键词 统计指数 概率抽样 数理统计学
下载PDF
不等概率抽样估计的原理与应用 被引量:1
11
作者 王静 《长春金融高等专科学校学报》 2009年第4期44-47,共4页
不等概率抽样估计是一种十分有效的抽样推断方法,它在实践中有着广泛的应用,采用不等概率抽样修正等概率抽样,可以弥补抽样调查中等概率抽样估计的不足。以对2007年全国各地区接待的入境旅游人数进行估计为例,在不等概率抽样原理的基础... 不等概率抽样估计是一种十分有效的抽样推断方法,它在实践中有着广泛的应用,采用不等概率抽样修正等概率抽样,可以弥补抽样调查中等概率抽样估计的不足。以对2007年全国各地区接待的入境旅游人数进行估计为例,在不等概率抽样原理的基础上,抽取样本,采用适当的方法进行测算,才能达到提高抽样估计效率的目的。 展开更多
关键词 不等概率抽样 方差估计 抽样效率
下载PDF
基于Brewer设计的不放回不等概率抽样方法
12
作者 王智光 闫在在 张婷婷 《统计与决策》 CSSCI 北大核心 2018年第7期9-13,共5页
文章通过将总体随机划分成n/2或(n+1)/2个组,在每组中按Brewer(1963)方法实施大小为2的严格按单元大小成比例不等概率抽样(πPS抽样),构造出总体总值的估计量,建立了相应的理论。通过数值比较发现给出的方法显著地改进了精度。
关键词 不等概率抽样 包含概率 辅助信息
下载PDF
一般方法的无放回不等概率抽样与πPS抽样的比较
13
作者 刘建平 王建丽 《统计与决策》 CSSCI 北大核心 2004年第12期10-11,共2页
关键词 不等概率抽样 已知 必要条件 总体 样本 性质 单元 一般方法 个性 数据处理
下载PDF
按与单位大小成比例的概率抽样
14
作者 谢小燕 林学杰 《上海统计》 1995年第9期18-19,共2页
大多数的抽样调查都是建立在对总体进行等概随机抽样的基础之上的.即当抽样框建立之后,抽样框中的每一个单位都有同样的概率被抽中.这种抽样方法并不适用于每一种抽样框.若不将所要调查的问题与抽样框中单位加以综合考虑,而都采用简单... 大多数的抽样调查都是建立在对总体进行等概随机抽样的基础之上的.即当抽样框建立之后,抽样框中的每一个单位都有同样的概率被抽中.这种抽样方法并不适用于每一种抽样框.若不将所要调查的问题与抽样框中单位加以综合考虑,而都采用简单随机抽样,甚至其它的一些复杂随机抽样的方法来进行推断,都将造成样本的偏斜.例如,某省旅游部门想了解接待国外旅游者的能力,一个最希望知道的信息是宾馆房间数,若所选择的抽样框是该省各大、中、小城市的目录表,一个地区的中小城市总是比大城市多,若用简单随机抽样,则样本中的中、小城市就很多,而中、小城市无论是宾馆数,还是宾馆的规模与大城市都有较大的差异,这就造成了样本的偏斜.同样。 展开更多
关键词 抽样调查 统计方法 概率抽样
下载PDF
概率抽样在审计中的应用研究
15
作者 唐庆银 《上海会计》 北大核心 2003年第10期55-57,共3页
关键词 概率抽样 审计 资本市场 记账凭证 分层抽样 不等概率系统抽样
下载PDF
基于动态概率抽样的标签噪声过滤方法 被引量:5
16
作者 张增辉 姜高霞 王文剑 《计算机应用》 CSCD 北大核心 2021年第12期3485-3491,共7页
在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对... 在机器学习问题中,数据质量对系统预测的准确性产生了深远的影响。由于信息获取的难度大,人类的认知主观且有限,导致了专家无法准确标记所有样本。而近年来出现的一些概率抽样方法无法避免样本人为划分不合理且主观性较强的问题。针对这一问题,提出一种基于动态概率抽样(DPS)的标签噪声过滤方法,充分考虑各个数据集样本间的差异性,通过统计各个区间内置信度分布频率,分析各个区间内置信度分布信息熵的走势,确定合理阈值。在UCI经典数据集中选取了14个数据集,将所提方法与随机森林(RF)、HARF、MVF、局部概率抽样(LPS)等方法进行了对比实验。实验结果表明,所提出的方法在标签噪声识别和分类泛化上均展示出了较高的能力。 展开更多
关键词 标签噪声 动态概率抽样 噪声过滤 标签置信度 置信度
下载PDF
基于局部概率抽样的标签噪声过滤方法 被引量:3
17
作者 张增辉 姜高霞 王文剑 《计算机应用》 CSCD 北大核心 2021年第1期67-73,共7页
分类学习任务中,在获取数据的过程中会不可避免地产生噪声,特别是标签噪声的存在不仅使得学习模型更复杂,而且容易造成过拟合并导致分类器泛化能力的下降。标签噪声过滤算法虽然在一定程度上可以解决上述问题,但是仍然存在噪声识别能力... 分类学习任务中,在获取数据的过程中会不可避免地产生噪声,特别是标签噪声的存在不仅使得学习模型更复杂,而且容易造成过拟合并导致分类器泛化能力的下降。标签噪声过滤算法虽然在一定程度上可以解决上述问题,但是仍然存在噪声识别能力较差、分类效果不够理想以及过滤效率低等问题。针对这些问题,提出一种基于标签置信度分布的局部概率抽样方法来进行标签噪声过滤。首先利用随机森林分类器对样本的标签进行投票,从而获取每个样本的标签置信度;然后根据标签置信度的大小,将样本划分为易识别样本和难识别样本;最后分别采用不同的过滤策略对样本进行过滤。实验结果表明,在标签噪声存在的情况下,所提方法在大多数案例上能够保持较高的噪声识别能力,并且在分类泛化性能上也具有明显优势。 展开更多
关键词 标签噪声 局部概率抽样 噪声过滤 随机森林 置信度估计
下载PDF
基于倾向得分多层模型的非概率抽样统计推断 被引量:4
18
作者 刘展 《统计与决策》 CSSCI 北大核心 2018年第23期11-15,共5页
文章针对具有嵌套结构数据的网络候选者数据库,提出基于倾向得分多层模型的非概率抽样推断方法:根据网络候选者数据库的调查样本和参考样本,构建多层回归模型对倾向得分进行估计,并将倾向得分估计的逆作为网络候选者数据库调查样本的调... 文章针对具有嵌套结构数据的网络候选者数据库,提出基于倾向得分多层模型的非概率抽样推断方法:根据网络候选者数据库的调查样本和参考样本,构建多层回归模型对倾向得分进行估计,并将倾向得分估计的逆作为网络候选者数据库调查样本的调整权数来估计总体。结果显示,基于倾向得分多层回归模型的总体估计效果较好,比基于倾向得分Logistic模型的总体估计的偏差更小,效率更高。 展开更多
关键词 倾向得分 多层模型 网络候选者数据库 概率抽样
下载PDF
抽样调查(Ⅵ)——第五讲 不等概率抽样 被引量:1
19
作者 彤季 《数理统计与管理》 1987年第6期43-49,共7页
关键词 不等概率抽样 无放回抽样 PPS抽样 抽样单元 抽样调查 估计量 方差估计 抽样方法 有放回抽样 家庭
下载PDF
非概率抽样样本容量的确定问题 被引量:3
20
作者 肖海燕 《山西大同大学学报(自然科学版)》 2018年第1期29-31,共3页
在网络科技与大数据迅猛发展的今天,非概率抽样有了更广泛的应用空间。非概率抽样主要是解决总体单元难以分辩的抽样问题。而抽样结果估计是否准确可信一定程度上依赖于样本量的确定。主要阐述了非概率抽样在精度、调查费用与损失的要... 在网络科技与大数据迅猛发展的今天,非概率抽样有了更广泛的应用空间。非概率抽样主要是解决总体单元难以分辩的抽样问题。而抽样结果估计是否准确可信一定程度上依赖于样本量的确定。主要阐述了非概率抽样在精度、调查费用与损失的要求下确定样本量的方法。 展开更多
关键词 概率抽样 样本容量 精度 费用 损失函数
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部