期刊文献+

一种基于规则的模糊中文地址分词匹配方法 被引量:48

A Rule-Based Segmenting and Matching Method for Fuzzy Chinese Addresses
下载PDF
导出
摘要 在研究分析地址模型的基础上,建立了存储标准地址数据集的标准地址库和自定义的地址匹配规则库,提出了一种基于规则的模糊中文地址编码方法。该方法在依据标准地址库分词的同时,也沿着自定义的地址匹配规则进行推理,从而缩小了下次分词所用到的目标数据集,提高了系统执行效率。另外,通过借助构建的规则树与歧义栈,提高了文中定义的两类模糊地址匹配的成功率。最后,基于该算法建立了一个地理编码原型系统,并利用经济普查项目中的相关数据对算法的可用性进行了验证。 After analyzing Chinese address model,this paper built a standard address database and an address matching rules database,and then presented a rule-based Geocoding method for fuzzy Chinese addresses.This method used the standard address database to segment the input fuzzy Chinese address.At the same time,the method used the rules database to reduce and find a standard address that matched with that fuzzy address.The method used the customized rules to reduce candidate addresses so that it can participate in match reduction and save the matching executive time.In addition,the introduction of rule tree and semantic stacks also promote the matching of fuzzy address.Finally,a Geocoding prototype system was built,and then its availability was verified utilizing the data of natural economic census project.
作者 程昌秀 于滨
出处 《地理与地理信息科学》 CSSCI CSCD 北大核心 2011年第3期26-29,共4页 Geography and Geo-Information Science
基金 国家863项目"经济普查与基本单位统计遥感应用系统"(2006AA120106) "地理空间数据库管理系统总体设计"(2007AA120401)
关键词 地理编码 模糊地址 规则库 地址分词 Geocoding fuzzy address rule database address segmentation
  • 相关文献

参考文献9

  • 1王凌云,李琦,江洲.国内地理编码数据库系统开发与研究[J].计算机工程与应用,2004,40(21):167-168. 被引量:33
  • 2李军,李琦,毛东军,郭玲玲.北京市地理编码数据库的研究[J].计算机工程与应用,2004,40(2):1-3. 被引量:44
  • 3陈细谦,迟忠先,金妮.城市地理编码系统应用与研究[J].计算机工程,2004,30(23):50-52. 被引量:29
  • 4孙亚夫,陈文斌.基于分词的地址匹配技术[A].中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C].2007.114-125.
  • 5张铁燕,翁敬农,黄坚.城市地理编码方法的探索与实践[A].中国地理信息系统协会第九届年会论文集[C].2005.
  • 6SENGAR V, JOSHI T, JOY J, et al. Robust Location Search from Text Queries. http://research, microsoft, com/en us/people/josephj/acm_gis_2007_robust_location_search. pdf, 2007-- 12--30.
  • 7GOLDBERG D W,WILSON J P, KNOBLOCK C A. From textto geographic coordinates; The current state of geocoding[J]. Urban and Regional Information Systems Association, 2007,19 (1):33--46.
  • 8郭会.基于自动机分词的中文地址地理编码技术研究与实现[D].北京:中国科学院地理所,2008.
  • 9高巍.在大城市实现有线电视用户地址标准化的设想[J].广播与电视技术,2007,34(10):99-102. 被引量:1

二级参考文献20

  • 1北京市信息资源管理中心.北京市信息资源网地理编码数据库设计总结报告[R].,2002-07..
  • 2方正数码.ECFounder MapSearch 1.0-地址编码二次开发手册[M].,2000.08.
  • 3北京市规划发展委员会.北京市地名管理办法[Z].,1983-03..
  • 4北京市规划发展委员会.北京市地名管理条例[Z].,1986-01..
  • 5北京市规划发展委员会.地名管理条例实施细则[Z].,1996-06..
  • 6北京市信息资源管理中心.北京市地理编码数据库一期建设方案[Z].,2002-09..
  • 7北京市信息资源管理中心.地理编码数据采集工艺[Z].,2003-01..
  • 8首都信息发展股份有限公司.北京市规划委员会地名管理信息系统总体设计方案[Z].,2001-04..
  • 9Tele Atlas.geocode com Eagle Geocoding Technology.http:∥www.2002-12
  • 10The Etak Geocoding Process.http:∥www.etak.com/.2002-01

共引文献85

同被引文献297

引证文献48

二级引证文献166

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部