摘要
大数据时代,对不同来源的数据进行整合是开展数据分析的第一步。记录链接(record linkage)是数据整合的核心技术之一。记录链接涉及了统计学、计算机科学的相关知识在欧美等发达国家,记录链接理论及实践已经有数十年的历史,但国内鲜有系统的研究。文章介绍了记录链接的基础统计模型——Fellegi-Sunter模型,归纳了实务应用流程,并介绍了应用案例,以期对我国的统计工作和大数据应用有所启迪。
出处
《统计与决策》
CSSCI
北大核心
2016年第7期78-82,共5页
Statistics & Decision