期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
不可忽略的无回答机制下的校准研究 被引量:2
1
作者 金勇进 刘晓宇 《统计与信息论坛》 CSSCI 北大核心 2020年第8期3-10,共8页
在实际调查工作中,由于客观条件的限制,难以完全避免无回答情况的出现。当无回答已经产生,且单元作答情况与目标变量本身有关系时,缺失数据机制不可忽略,需要在数据分析阶段弥补无回答对估计产生的负面影响。现有方法多假定缺失数据机... 在实际调查工作中,由于客观条件的限制,难以完全避免无回答情况的出现。当无回答已经产生,且单元作答情况与目标变量本身有关系时,缺失数据机制不可忽略,需要在数据分析阶段弥补无回答对估计产生的负面影响。现有方法多假定缺失数据机制为随机缺失,少数非随机缺失机制下的方法基于模型进行推断,但因其对模型假设和模型识别的较强要求造成了应用上的局限性。校准估计已在抽样推断中得到了广泛应用,它在利用辅助信息提高样本代表性的同时,控制了无回答误差。采用RGRG法将模型校准法与准随机化的响应模型相结合,解决非随机缺失下的权数调整和总体估计问题。对RGRG法的估计过程和估计优势进行了理论分析和实证研究。结果表明,在不可忽略的无回答机制下,通过RGRG法的调整降低了最终权数的变异性;加权估计量具有更小的偏差、标准误差和均方误差根,具有渐进无偏性和渐近一致性。同时,该方法是稳健的,对无回答具有双重保护作用,允许响应模型和超总体模型仅在一定程度上拟合总体,降低了对模型识别的敏感度。 展开更多
关键词 非随机缺失 不可忽略的无回答机制 校准法 响应模型
下载PDF
基于机器学习聚类的无回答权数调整研究 被引量:3
2
作者 金勇进 刘晓宇 《调研世界》 CSSCI 2020年第10期11-19,共9页
在实际调查工作中,由于客观条件的限制,难以完全避免无回答情况的出现,需在数据分析阶段弥补无回答对估计产生的负面影响。本文尝试通过机器学习中的聚类算法进行无回答权数调整,以突破可忽略性的限制,着重考察在不可忽略的无回答机制... 在实际调查工作中,由于客观条件的限制,难以完全避免无回答情况的出现,需在数据分析阶段弥补无回答对估计产生的负面影响。本文尝试通过机器学习中的聚类算法进行无回答权数调整,以突破可忽略性的限制,着重考察在不可忽略的无回答机制下的估计效果。实证研究根据2015年中国综合社会调查(CGSS)数据进行,结果表明,无论无回答机制是否可忽略,基于机器学习聚类算法进行的权数调整,均能有效控制无回答偏差、得到变异性小的最终权数和性质优良的目标变量估计。 展开更多
关键词 非随机缺失 不可忽略的无回答机制 权数调整 聚类分析
下载PDF
固定样组纵向调查“间歇式”期单元无回答的加权调整 被引量:1
3
作者 杨宝慧 孙山泽 《应用概率统计》 CSCD 北大核心 2002年第4期363-369,共7页
期单元无回答误差是固定样组纵向调查中经常出现的一类非抽样误差.如果不对之进行调整,则往往造成估计量的偏差.已经提出的两种加权调整方法不易处理“间歇式”期单元无回答.在本文中,我们提出了纵横加权调整方法,这一方法克服了已有方... 期单元无回答误差是固定样组纵向调查中经常出现的一类非抽样误差.如果不对之进行调整,则往往造成估计量的偏差.已经提出的两种加权调整方法不易处理“间歇式”期单元无回答.在本文中,我们提出了纵横加权调整方法,这一方法克服了已有方法的不足.我们所作的模拟研究表明,纵横加权方法降低了估计量的偏差,并在作两调查期指标均值变化分析时,充分利用了两期回答状态的相关信息,提高了变化估计量的准确度. 展开更多
关键词 “间歇式” 固定样组纵向调查 期单元无回答 回答机制 加权 变化估计量
下载PDF
响应倾向得分匹配插补法 被引量:4
4
作者 杨贵军 孙玲莉 李璐 《统计与信息论坛》 CSSCI 北大核心 2018年第8期3-11,共9页
倾向得分匹配插补法是处理无回答的常用方法,该方法对无回答与回答的样本量差异较为敏感。提出响应倾向得分匹配插补法,建立回答单元响应变量观测值秩变换的响应倾向得分模型,匹配无回答单元和回答单元的响应倾向得分,选择响应倾向得分... 倾向得分匹配插补法是处理无回答的常用方法,该方法对无回答与回答的样本量差异较为敏感。提出响应倾向得分匹配插补法,建立回答单元响应变量观测值秩变换的响应倾向得分模型,匹配无回答单元和回答单元的响应倾向得分,选择响应倾向得分相近的回答单元作为无回答单元的插补值。模拟研究表明,响应倾向得分匹配插补法的插补效果优于原倾向得分匹配插补法、最近邻插补法和回归插补法。在完全随机无回答机制和随机无回答机制下,随着插补重数增加,采用响应倾向得分匹配插补法的回归系数估计量的偏差绝对值和均方误差呈递增趋势。在实际应用中,插补重数选择不宜过高,建议插补重数为5。针对Sparrows数据集的分析结果显示,采用响应倾向得分匹配插补法处理无回答,能够较好估计回归模型系数。响应倾向得分匹配插补法有效改进原倾向得分匹配插补法,提高了统计分析结果的可靠性。 展开更多
关键词 响应倾向得分匹配插补法 插补重数 回答 回答机制
下载PDF
西安交通大学图书馆实时咨询系统的建设与服务 被引量:6
5
作者 强自力 《大学图书馆学报》 CSSCI 北大核心 2004年第3期53-55,共3页
概述了西安交通大学图书馆实时咨询系统的开发过程以及实时咨询服务的开展情况,探讨了实时咨询系统中自动回答机制的可行性,提出实时咨询系统的本质特点是同步浏览,实时咨询不能代替其他异步的数字咨询方式,要重视系统的开发,但更要重... 概述了西安交通大学图书馆实时咨询系统的开发过程以及实时咨询服务的开展情况,探讨了实时咨询系统中自动回答机制的可行性,提出实时咨询系统的本质特点是同步浏览,实时咨询不能代替其他异步的数字咨询方式,要重视系统的开发,但更要重视实时咨询服务的提供。 展开更多
关键词 西安交通大学 图书馆 实时咨询系统 自动回答机制 咨询软件
下载PDF
基于DA插补法的线性回归模型系数估计值的模拟研究 被引量:5
6
作者 杨贵军 骆新珍 《统计与信息论坛》 CSSCI 2014年第3期3-8,共6页
Data Augmentation(DA)插补法是最常用的MCMC多重插补法之一。利用模拟方法研究基于DA插补法的线性回归模型的系数估计值,分析估计值的统计性质受无回答机制、无回答率和插补重数的影响。模拟结果显示:在完全随机无回答机制下,选择较小... Data Augmentation(DA)插补法是最常用的MCMC多重插补法之一。利用模拟方法研究基于DA插补法的线性回归模型的系数估计值,分析估计值的统计性质受无回答机制、无回答率和插补重数的影响。模拟结果显示:在完全随机无回答机制下,选择较小插补重数常常会得到较好的回归系数估计值;在随机无回答机制下,随着无回答率增大而选择更大插补重数往往会得到更好的回归系数估计值;在非随机无回答机制下,选择更大插补重数并不一定总会得到更好的回归系数估计值。 展开更多
关键词 DA多重插补法 回答机制 回答 插补重数
下载PDF
基于少数类过采样的倾向得分匹配插补法 被引量:4
7
作者 杨贵军 杜飞 孙玲莉 《统计与信息论坛》 CSSCI 北大核心 2021年第1期3-12,共10页
无回答在大数据应用中频繁发生。通常,实际数据的无回答率较低,在这样的情况下,采用倾向得分模型对无回答单元与回答单元进行匹配,易导致倾向得分匹配插补法的插补效果显著下降。为此,将合成少数类过采样算法的思想融入到倾向得分匹配... 无回答在大数据应用中频繁发生。通常,实际数据的无回答率较低,在这样的情况下,采用倾向得分模型对无回答单元与回答单元进行匹配,易导致倾向得分匹配插补法的插补效果显著下降。为此,将合成少数类过采样算法的思想融入到倾向得分匹配插补法中,提出基于少数类过采样的倾向得分匹配插补法。利用统计模拟与实证研究,在不同无回答率、插补重数和误差分布情形下,演示新插补法的统计性质和应用效果。统计模拟显示,新插补法具有明显高于倾向得分匹配插补法的精度,统计性质受无回答率、插补重数和误差分布的影响小。实证结果显示,新插补法在实际数据中具有较好的应用性。基于少数类过采样的倾向得分匹配插补法提供了处理无回答问题的新思路,并具有较好的扩展性。 展开更多
关键词 倾向得分匹配插补法 合成少数类过采样算法 回答 回答机制
下载PDF
常用多重插补法的插补重数选择 被引量:9
8
作者 孙玲莉 董世杰 杨贵军 《统计与决策》 CSSCI 北大核心 2019年第23期5-10,共6页
社会经济调查领域普遍存在无回答现象。目前处理无回答的常用方法是多重插补法。文章重点研究常用的六种多重插补法:PMM多重插补法、DA多重插补法、EMB多重插补法、普通线性回归多重插补法、贝叶斯线性回归多重插补法和自助线性回归多... 社会经济调查领域普遍存在无回答现象。目前处理无回答的常用方法是多重插补法。文章重点研究常用的六种多重插补法:PMM多重插补法、DA多重插补法、EMB多重插补法、普通线性回归多重插补法、贝叶斯线性回归多重插补法和自助线性回归多重插补法。首先,比较六种多重插补法理论性质。其次,重点模拟研究三种线性回归多重插补法对回归模型系数估计的影响。最后,对比分析六种多重插补法的应用条件,给出使用不同多重插补法的插补重数建议。 展开更多
关键词 回答 多重插补法 回答机制 插补重数
下载PDF
复杂设计下类均值复制与类加权均值复制的比较(英文)
9
作者 杨宝慧 孙山泽 《应用概率统计》 CSCD 北大核心 2002年第3期225-229,共5页
复制数据是处理抽样调查中数据项目缺失的一种常用方法.在两种常见模型及复杂抽样设计下,本文对处理数据项目缺失的类均值复制和类加权均值复制方法进行了对比.
关键词 下类均值复制 类加权均值复制 项目缺失 单元缺失 一致回答机制 模型推断 抽样调查 数据复制
下载PDF
Ranking Potential Reply-Providers in Community Question Answering System 被引量:4
10
作者 韩闻文 阙喜戎 +2 位作者 宋思奇 田野 王文东 《China Communications》 SCIE CSCD 2013年第10期125-136,共12页
Community Question Answering (CQA) websites have greatly facilitated users' lives, with an increasing number of people seeking help and exchanging ideas on the Internet. This newlymerged community features two char... Community Question Answering (CQA) websites have greatly facilitated users' lives, with an increasing number of people seeking help and exchanging ideas on the Internet. This newlymerged community features two characteristics: social relations and an ask-reply mechanism. As users' behaviours and social statuses play a more important role in CQA services than traditional answer retrieving websites, researchers' concerns have shifted from the need to passively find existing answers to actively seeking potential reply providers that may give answers in the near future. We analyse datasets derived from an online CQA system named "Quora", and observed that compared with traditional question answering services, users tend to contribute replies rather than questions for help in the CQA system. Inspired by the findings, we seek ways to evaluate the users' ability to offer prompt and reliable help, taking into account activity, authority and social reputation char- acteristics. We propose a hybrid method that is based on a Question-User network and social network using optimised PageRank algorithm. Experimental results show the efficiency of the proposed method for ranking potential answer-providers. 展开更多
关键词 CQA user behaviour analysis question-user network social network PAGERANK activity estimation authority estimation
下载PDF
基于EMB多重插补法的线性模型系数估计量的模拟研究 被引量:7
11
作者 杨贵军 孙玲莉 孟杰 《数量经济技术经济研究》 CSSCI 北大核心 2016年第10期128-141,共14页
基于EMB多重插补法的线性模型系数估计量,分析其统计性质,并与PMM多重插补法以及DA插补法进行比较。模拟结果显示,随着无回答率增加,系数估计量的偏差绝对值、均方误差呈递增趋势,估计方差的递增趋势相对更显著。在完全随机无回答机制... 基于EMB多重插补法的线性模型系数估计量,分析其统计性质,并与PMM多重插补法以及DA插补法进行比较。模拟结果显示,随着无回答率增加,系数估计量的偏差绝对值、均方误差呈递增趋势,估计方差的递增趋势相对更显著。在完全随机无回答机制或随机无回答机制下,建议插补重数为15。在依赖被解释变量的非随机无回答机制下,建议插补重数可适当增大。在依赖其他变量的非随机无回答机制下,估计量的均方误差和估计方差的差异大,使用EMB多重插补法要谨慎。 展开更多
关键词 EMB 多重插补法 回答机制 回答
原文传递
基于PMM多重插补法的线性模型系数估计量的模拟研究 被引量:5
12
作者 杨贵军 李静华 《数量经济技术经济研究》 CSSCI 北大核心 2014年第10期139-150,共12页
在利用含无回答的经济数据建立线性回归模型之前,选择PMM多重插补法给出无回答的插补值。模拟结果显示,在任意无回答机制下,随着插补重数增大,系数估计量的偏差和均方误差减小不显著。对于任意无回答率,建议插补重数为5。在完全随机无... 在利用含无回答的经济数据建立线性回归模型之前,选择PMM多重插补法给出无回答的插补值。模拟结果显示,在任意无回答机制下,随着插补重数增大,系数估计量的偏差和均方误差减小不显著。对于任意无回答率,建议插补重数为5。在完全随机无回答机制下,随着无回答率增加,系数估计量的偏差或均方误差增大往往不显著。然而,在随机无回答机制下或在非随机无回答机制下,随着无回答率增加,系数估计量的偏差和均方误差增大往往显著。 展开更多
关键词 插补法 回答机制 回答 插补重数
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部