期刊文献+

自然语言理解的中文地址匹配算法 被引量:28

Address matching algorithm based on chinese natural language understanding
原文传递
导出
摘要 在分析现有3类主要的中文地址匹配算法:要素层级匹配法、全文检索法、正则表达式法的基础上,提出了基于自然语言理解的中文地址匹配算法。新算法中建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题。新算法的完整流程包括预处理、地址解析、地址要素标准化、推理匹配和匹配登记等5个环节,本文重点阐述了地址解析和推理匹配这两个重要环节,分别依据"自然语言理解"中的中文分词和语义推理原理,对用非结构化的中文自然语言描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法。为验证该算法,开发了中文地址智能匹配实验系统,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%。 Address matching algorithm that has broad application prospects is the core and key technology for location-based services. This paper analyzes the existing three major address matching algorithms which are the level based matching algorithm, the full-text search algorithm and the regular expression algorithm. An address matching algorithm based on Chinese natural language understanding is proposed in this paper. The complete process of this new algorithm includes five parts as pretreatment, address parsing, address elements standardization, reasoning about address matching and matching registration. This paper focuses on address parsing and reasoning matching the two most important parts. The paper establishes a complete Chinese address matching algorithm based on natural language understanding. In the principle of Chinese segmentation and semantic reasoning in natural language understanding, the new algorithm achieves the goal to combine natural language understanding with address matching by processing Chinese address of unstructured format. To check the new algorithm, an address matching experimental system was developed. The matching experiment using 1000 resident addresses of Puyang city, Henan province shows that the matching rate can be 95% or more and the accuracy rate is above 93%.
作者 宋子辉
出处 《遥感学报》 EI CSCD 北大核心 2013年第4期788-801,共14页 NATIONAL REMOTE SENSING BULLETIN
基金 国家高技术研究发展计划(863计划)(编号:2012AA12A401)~~
关键词 自然语言理解 地址匹配 地址要素 地址解析 隐马尔科夫模型 natural language understanding address matching address element address parsing Hidden Markov Model
  • 相关文献

参考文献7

二级参考文献47

  • 1朱建伟,王泽民.地理编码原理及其本地化解决方案[J].北京测绘,2004,18(2):24-27. 被引量:16
  • 2陈细谦,迟忠先,金妮.城市地理编码系统应用与研究[J].计算机工程,2004,30(23):50-52. 被引量:29
  • 3黄波.基于扩展SQL的GIS模糊查询的表达与实现[J].武汉测绘科技大学学报,1996,21(1):86-89. 被引量:14
  • 4刘开瑛 郭炳炎.自然语言理解[M].北京:科学出版社,1991.31-41.
  • 5李霖.地理信息系统空间目标查询模型的研究[M].武汉:武汉测绘科技大学,1997..
  • 6Clodoveu A, Davis J, Fonseca F T. Assessing the Certainty of Locations Produced by an Address Geocoding System[J]. Geoinformatica, 2007, 11(1): 103-129.
  • 7Zhang Xuzhu, Ma Haoming, Li Qi. An Address Geocoding Solution for Chinese Cities[C]//Proc. of Geoinformatics Conference. Wuhan, China: [s. n.], 2006: 1-9.
  • 8Morad M. British Standard 7666 as a Framework for Geocoding Land and Property Information[J]. Computers, Environment and Urban Systems, 2002, 26(5): 483-492.
  • 9孙亚夫,陈文斌.基于分词的地址匹配技术[C].中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集,2007,114-125.
  • 10张铁燕,翁敬农,黄坚.城市地理编码方法的探索与实践[C] // 中国地理信息系统协会第九届年会论文集.杭州:中国地理信息系统协会,2005:731-736.

共引文献132

同被引文献247

引证文献28

二级引证文献92

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部