-
题名一种集成词汇-结构-语义表示的地址匹配策略
- 1
-
-
作者
亢孟军
何欣阳
刘诚
王明军
高宇灵
-
机构
武汉大学资源与环境科学学院
城市空间信息工程北京市重点实验室
-
出处
《地球信息科学学报》
EI
CSCD
北大核心
2023年第7期1378-1385,共8页
-
基金
自然资源部城市国土资源监测与仿真重点实验室开放基金资助课题(KF-2019-04-064)
国家重点研发计划项目(2022YFC3005700)。
-
文摘
地址匹配是地理编码的核心基础,本文针对现有地址匹配算法与地址数据库反馈交互局限性问题,提出词汇-结构-语义三层解构地址的匹配处理策略。词汇层通过地名词典和结合尾字特征的正则表达式定义粒度剖分规则,以地址词元素为基本单元完成词汇级别解析;结构层定义地址模式类型以实例化数据组织,完成顾及上下地址层级结构的模型匹配;语义层抽象地址语义形式化表达,实现融合深度语义的地址匹配。同时,本文在综合地址词元素筛选、地址层级结构剖分和地址语义理解基础上对经过完全解析的地址数据不断反哺作为数据参考,从而实现数据库支持下的算法逻辑绑定与结果集成。本文以浙江省湖州市德清县地址数据作为实例进行验证,实验结果表明,在低重复率的多次采样实验下,平均匹配率达到92.83%,正确率为95.37%;通过实例分析表明,本文方法在完善地址参考库的基础上改进算法性能和精度,能有效解决地址结构缺失和语义近似推断,适应多样地址类型。
-
关键词
地址语言模型
地址匹配
集成策略
地址参考库
地址匹配度标准化
-
Keywords
address language model
address matching
integration strategy
address reference library
address matching standardization
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-