期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
数据挖掘方法应用于调查数据的抽样权重问题——基于放回比例抽样的再抽样方法 被引量:4
1
作者 谢佳斌 金勇进 谢邦昌 《统计研究》 CSSCI 北大核心 2009年第4期101-104,共4页
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略... 在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量。这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。 展开更多
关键词 调查数据 抽样权重 数据挖掘 ppwwr再抽样
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部