期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于分布式ElasticSearch相似内容比对算法研究 被引量:5
1
作者 马智勤 廖雪花 +1 位作者 邓威 肖文超 《计算机与数字工程》 2020年第12期2843-2849,共7页
文中提出了一种基于ElasticSearch分布式搜索引擎文本相似度比对优化方案,该方法在ElasticSearch搜索引擎自身文本比对模型(TF-IDF模型)的基础上进行优化,以提高文本比对的精确度。在优化方法中通过配置远程词典、热更新词库和修改文本... 文中提出了一种基于ElasticSearch分布式搜索引擎文本相似度比对优化方案,该方法在ElasticSearch搜索引擎自身文本比对模型(TF-IDF模型)的基础上进行优化,以提高文本比对的精确度。在优化方法中通过配置远程词典、热更新词库和修改文本比对模型等方式,实现了语义匹配、近义词匹配、段落替换匹配。同时解决了ElasticSearch中词序替换不能匹配、语义替换不能匹配、新词不能识别的问题。同时,基于ElasticSearch搜索语法,提出了一种动态调整特殊位置的文本权重以提高文本主题比对精确度的方法。另外,该优化方案搭建了ElasticSearch集群,实现了文本的可靠访问和分散多分片存储,从而提高系统高可用、低延迟和容灾能力。 展开更多
关键词 ElasticSearch 相似内容比对 TF-IDF算法 语义匹配 热更新
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部