期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
数据挖掘方法应用于调查数据的抽样权重问题——基于放回比例抽样的再抽样方法
被引量:
4
1
作者
谢佳斌
金勇进
谢邦昌
《统计研究》
CSSCI
北大核心
2009年第4期101-104,共4页
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略...
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量。这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。
展开更多
关键词
调查数据
抽样
权重
数据挖掘
ppwwr再抽样
下载PDF
职称材料
题名
数据挖掘方法应用于调查数据的抽样权重问题——基于放回比例抽样的再抽样方法
被引量:
4
1
作者
谢佳斌
金勇进
谢邦昌
机构
中国人民大学统计学院
中国台湾辅仁大学统计信息学系
中国台湾辅仁大学应用统计所
中华资料采矿协会(台湾)
厦门大学经济学院
出处
《统计研究》
CSSCI
北大核心
2009年第4期101-104,共4页
文摘
在将数据挖掘方法应用于抽样调查数据时,会遇到抽样权重的处理问题。本文提出采用放回的、与样本单元权数大小成比例的再抽样方法,简称PPWWR再抽样,来实现"事后"自加权设计。实现"事后"自加权设计后的子样本可忽略掉样本权数,直接采用常规的图示方法和数据挖掘算法进行分析。随后,基于2007中国公民科学素质调查贵州省数据,通过模拟分析讨论了PPWWR再抽样子样本的样本量问题,发现max(n,5%N)是一个比较合适的样本量。这一结论可能为其他大型复杂抽样调查数据的数据挖掘实施问题提供借鉴。
关键词
调查数据
抽样
权重
数据挖掘
ppwwr再抽样
Keywords
Survey data
Sampling weights
Data mining
ppwwr
re-sampling
分类号
C811 [社会学—统计学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
数据挖掘方法应用于调查数据的抽样权重问题——基于放回比例抽样的再抽样方法
谢佳斌
金勇进
谢邦昌
《统计研究》
CSSCI
北大核心
2009
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部