期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
顾及字符特征的中文地名词典查询方法 被引量:6
1
作者 叶鹏 张雪英 杜咪 《地球信息科学学报》 CSCD 北大核心 2018年第7期880-886,共7页
地名词典查询是地名校正、地名匹配等地名服务应用的重要基础,但是地名数量的快速增长使得词典查询性能面临严峻挑战。针对大规模数据环境中传统词典查询方法准确率不高且效率较低等问题,提出了一种顾及字符特征的中文地名词典查询方法(... 地名词典查询是地名校正、地名匹配等地名服务应用的重要基础,但是地名数量的快速增长使得词典查询性能面临严峻挑战。针对大规模数据环境中传统词典查询方法准确率不高且效率较低等问题,提出了一种顾及字符特征的中文地名词典查询方法(CGQM)。首先,查询具有相同字符特征的地名形成候选地名集合,同时构建单字索引提升查询效率;其次,依据字符数量特征比较查询地名与候选地名的差异,进一步过滤候选地名集合;最后,基于字符位置特征优化查询结果排序策略,使得结果排序更为合理。实验以全国地名词典为例,构建5组测试集进行CGQM方法与Lucene检索方法的对比分析。研究结果表明,CGQM方法对于增强地名词典查询功能、提升查询效率具有实际意义。 展开更多
关键词 中文地名 地名词典查询 地名词典单字索引 地名相似度 地名字符特征
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部