期刊文献+

基于模糊匹配的数据清洗 被引量:2

Data cleaning based on fuzzy match
下载PDF
导出
摘要 提出了一种新的模糊匹配相似度函数及一种高效的模糊匹配算法 ,该算法能够高效的寻找与输入元组最相似的L个参考元组 ;为了提高查询效率 ,提出了对参照关系建立错误容错索引。 This paper proposes a new fuzzy match similarity function and an efficient algorithm which can quickly look up L tuples in reference tables.In order to improve querying efficiently,this paper creates the error tolerant index basing reference relations.
作者 周咏梅
出处 《湘潭师范学院学报(自然科学版)》 2004年第1期41-44,共4页 Journal of Xiangtan Normal University (Natural Science Edition)
关键词 模糊匹配 数据清洗 相似度函数 错误容错索引 数据仓库 similarity function fuzzy match error tolerant lndex data cleaning
  • 相关文献

参考文献5

  • 1[1]Cohen W.Integration of heterogeneous databases without common domains using queries based on textual similarity[A].Proceedings of ACM SIGMOD[C].Seattle:WA,1998.
  • 2[2]Cohen W.Data integration using similarity joins and a word-based information representation language[J].ACM Transactions on Information Systems,2000,18(3):288-321.
  • 3[3]Navarro G,Baeza-Yates R, Sutinen E, Tarhio J.Indexing methods for approximate string matching[J].IEEE Data Engineering Bulletin,2001,24(4):19-27.
  • 4[4]Navarro G,Baeza-Yates R, Sutinen E, Tarhio J.Indexing text with approximate n-grams[A].Proceedings of the 11th Annual Symposium on Combinatorial Pattern Matching (CPM'2000)[C].LNCS1848,2000.
  • 5[5]Navarro G.Searching in metric spaces by spatial approximation[J].The VLDB Journal,2002,1(1):28-46.

同被引文献15

引证文献2

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部