期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于n-gram中英文字符串分割算法实现 被引量:2
1
作者 何晓明 洪亲 +1 位作者 蔡坚勇 林鸿 《电脑知识与技术(过刊)》 2012年第8X期5530-5533,共4页
相似字符串的模糊查询是信息检索的重要组成部分,一直是人们研究的热点。目前基于关键词的查询技术都是前缀匹配,无法查找到与搜索字符串相似的结果。该文提出一种基于n-gram的中英文字符串分割技术的算法,该技术主要是对字符串进行中... 相似字符串的模糊查询是信息检索的重要组成部分,一直是人们研究的热点。目前基于关键词的查询技术都是前缀匹配,无法查找到与搜索字符串相似的结果。该文提出一种基于n-gram的中英文字符串分割技术的算法,该技术主要是对字符串进行中英文识别,然后基于n-gram按照指定长度进行分割,该技术是实现基于关键词的模糊查询技术的基础。该技术在数据清洗以及学位论文TMLC系统和垃圾邮件过滤等方面也有重要的应用前景。 展开更多
关键词 模糊查询 N-GRAM 字符串分割 编辑距离 数据挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部