-
题名顾及字符特征的中文地名词典查询方法
被引量:6
- 1
-
-
作者
叶鹏
张雪英
杜咪
-
机构
南京师范大学虚拟地理环境教育部重点实验室
江苏省地理信息资源开发与利用协同创新中心
-
出处
《地球信息科学学报》
CSCD
北大核心
2018年第7期880-886,共7页
-
基金
国家自然科学基金项目(41671393
41631177)
+4 种基金
国家重点研发计划(2017YFB0503602)
江苏省高校自然资助项目(15KJA420002)
公安部科技强警基础工作专项项目(2016GABJC43
2017GABJC23)
警用地理信息技术公安部重点实验室开放课题(2016LPGIT01)~~
-
文摘
地名词典查询是地名校正、地名匹配等地名服务应用的重要基础,但是地名数量的快速增长使得词典查询性能面临严峻挑战。针对大规模数据环境中传统词典查询方法准确率不高且效率较低等问题,提出了一种顾及字符特征的中文地名词典查询方法(CGQM)。首先,查询具有相同字符特征的地名形成候选地名集合,同时构建单字索引提升查询效率;其次,依据字符数量特征比较查询地名与候选地名的差异,进一步过滤候选地名集合;最后,基于字符位置特征优化查询结果排序策略,使得结果排序更为合理。实验以全国地名词典为例,构建5组测试集进行CGQM方法与Lucene检索方法的对比分析。研究结果表明,CGQM方法对于增强地名词典查询功能、提升查询效率具有实际意义。
-
关键词
中文地名
地名词典查询
地名词典单字索引
地名相似度
地名字符特征
-
Keywords
Chinese place name
gazetteer query
Chinese gazetteer index for single Chinese characters
the similarity of place name
place name character features
-
分类号
P281
[天文地球—地图制图学与地理信息工程]
-