摘要
记录链接的技术问题与统计理论密切相关,尤其是在建立记录链接分类规则时需要构建统计模型,识别关键变量以完成数据匹配。在贝叶斯框架下构建分层模型整合行政记录,通过多元回归可以实现匹配错误率的估计,而且一对一限制下的记录链接允许通过模块反映记录信息的来源变化,基于MCMC模拟的后验分布计算方便,有助于提高数据整合效率。
Technical issues about record linkage require a combination of statistical theory to resolve, especially in the establishment of record linkage classification rules, we need to build a statistical model to identify critical variables in order to complete the data match. Build hierarchical model to integrate administrative records under the Bayesian framework, can estimate matching error rate by multiple regression, and allows block to reflect the change of information sources under restriction of one to one integration, the posterior distribution calculated based MCMC simulation is convenient, help to improve the efficiency of data matching.
出处
《统计与信息论坛》
CSSCI
北大核心
2016年第7期30-35,共6页
Journal of Statistics and Information
基金
江西省高校人文社会科学重点研究基地项目<行政记录数据的开发及其在政府统计中的应用研究>(JD1412)
教育部人文社会科学研究青年基金项目<信贷约束与学习行为交互作用下金融外部性对逆周期监管的影响研究>(15YJC630194)
国家自然科学基金青年项目<逆周期资本监管框架下考虑跳跃行为的信用风险度量研究>(71401069)
关键词
记录链接
贝叶斯方法
分层模型
record linkage
Bayesian methods
hierarchical model