期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于地名相似度算法与空间场景相似性评价的地址规范化研究 被引量:1
1
作者 向雯婷 郭旦怀 《科研信息化技术与应用》 2013年第1期67-73,共7页
地理编码技术通过将位置信息的文字表述转化为经纬度坐标为地理位置信息相关的科研提供数据支持。在地理编码过程中,地址描述性文字可能存在大量内容不正确、不准确、错别字、同音字等问题,从而导致无法进行准确地址匹配。该文针对以上... 地理编码技术通过将位置信息的文字表述转化为经纬度坐标为地理位置信息相关的科研提供数据支持。在地理编码过程中,地址描述性文字可能存在大量内容不正确、不准确、错别字、同音字等问题,从而导致无法进行准确地址匹配。该文针对以上问题提出了一种地址规范化的方法,通过地名相似度算法将待规范地名与标准地名库记录进行匹配,并结合空间场景相似性对结果进行评价,从而提高地址匹配的准确度。最后通过相关公共卫生数据验证了方法的可行性与准确性。 展开更多
关键词 地理编码 地址匹配 地址规范化 地名相似度算法 空间场景相似
原文传递
顾及字符特征的中文地名词典查询方法 被引量:6
2
作者 叶鹏 张雪英 杜咪 《地球信息科学学报》 CSCD 北大核心 2018年第7期880-886,共7页
地名词典查询是地名校正、地名匹配等地名服务应用的重要基础,但是地名数量的快速增长使得词典查询性能面临严峻挑战。针对大规模数据环境中传统词典查询方法准确率不高且效率较低等问题,提出了一种顾及字符特征的中文地名词典查询方法(... 地名词典查询是地名校正、地名匹配等地名服务应用的重要基础,但是地名数量的快速增长使得词典查询性能面临严峻挑战。针对大规模数据环境中传统词典查询方法准确率不高且效率较低等问题,提出了一种顾及字符特征的中文地名词典查询方法(CGQM)。首先,查询具有相同字符特征的地名形成候选地名集合,同时构建单字索引提升查询效率;其次,依据字符数量特征比较查询地名与候选地名的差异,进一步过滤候选地名集合;最后,基于字符位置特征优化查询结果排序策略,使得结果排序更为合理。实验以全国地名词典为例,构建5组测试集进行CGQM方法与Lucene检索方法的对比分析。研究结果表明,CGQM方法对于增强地名词典查询功能、提升查询效率具有实际意义。 展开更多
关键词 中文地名 地名词典查询 地名词典单字索引 地名相似度 地名字符特征
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部