期刊文献+

多策略中文地址匹配方法 被引量:1

Multi-strategy chinese address matching method
下载PDF
导出
摘要 地址匹配是地理编码过程中一个关键环节,是实现数据空间化的关键技术之一。针对当前中文地址匹配方法的精确率、匹配率和时间开销不能兼顾的问题,本文提出了一种多策略中文地址匹配方法。通过建立轻量级的词典进行中文地址分词,同时构建多叉树存储分词后的地址数据,匹配过程中结合模糊匹配和层级回溯匹配共同完成地址匹配工作,最终基于真实数据进行了试验。试验结果表明,该方法在匹配率、精确率和时间开销3个指标上较当前其他匹配方法表现得更加均衡。 Address matching is a crucial link in geocoding and is one of the key technologies to realize data spatialization. Aiming at the problem that the matching rate, accuracy and time cost of the current Chinese address matching method cannot be taken into account, this study proposes a multi-strategy Chinese address matching method. The main idea is to build a lightweight dictionary for Chinese address segmentation and a multi-tree to store the address data after creating words participle. In the matching process, the fuzzy matching and hierarchical backtracking matching are combined to complete the address matching. Based on real data, this paper conducts experiments, and the results show that this method is more balanced than other matching methods in matching rate, accuracy rate and time cost.
作者 彭雨龙 胡顺石 吴涛 PENG Yulong;HU Shunshi;WU Tao(College of Geographic Sciences,Hunan Normal University,Changsha 410081,China;Key Laboratory of Geospatial Big Data Mining and Application,Hunan Province,Hunan Normal University,Changsha 410081,China)
出处 《测绘通报》 CSCD 北大核心 2022年第2期145-148,共4页 Bulletin of Surveying and Mapping
基金 湖南省自然科学基金项目(2018JJ3348) 湖南省教育厅科学研究项目(17C0952)。
关键词 地址匹配 中文地址分词 多叉树 层级回溯 余弦相似度 address matching Chinese address segmentation multi-tree hierarchical backtracking cosine similarity
  • 相关文献

参考文献13

二级参考文献101

共引文献88

同被引文献13

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部