-
题名基于文本相似性技术的地址文本补全系统设计与实现
- 1
-
-
作者
廖洪亮
-
机构
福建南安农村商业银行股份有限公司
-
出处
《信息记录材料》
2024年第10期73-75,共3页
-
文摘
当前地址信息应用领域日益广泛,地址文本信息的完整性、规范性、准确性尤为重要。因历史原因,现有银行系统中收录的地址文本信息出现了各种录入不完整、关键字段缺失等问题,导致后续地址文本信息解析成经纬度信息时无法解析、解析偏差较大等。本文基于文本相似性技术,设计实现了一种高效率、高准确度,能够快速整合接入各类应用的地址信息补全系统。该系统通过中文分词、杰卡德相似系数算法,计算不完整地址文本信息与现有完整地址文本信息的相似度,来补全不完整的地址文本信息,从而实现地址文本信息的准确解析。本文通过一组实验数据验证测试系统效果:若相似系数≥0.3,地址文本补全并解析后的准确率可达70%以上,较符合实际应用。
-
关键词
地址文本补全
文本相似性
中文分词
杰卡德相似系数
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-