期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
自然语言文本复制检测算法
1
作者 杨达 《电脑与信息技术》 2014年第4期11-14,共4页
复制检测就是检测文档之间是否存在雷同现象,并将检测结果报告给用户。文章算法将复制检测技术指纹比对法和词频统计法结合起来,首先对文本进行预处理如滤除介词、冠词等,采用指纹比对法判断自然段落之间的相似性;然后将一个自然段视为... 复制检测就是检测文档之间是否存在雷同现象,并将检测结果报告给用户。文章算法将复制检测技术指纹比对法和词频统计法结合起来,首先对文本进行预处理如滤除介词、冠词等,采用指纹比对法判断自然段落之间的相似性;然后将一个自然段视为一个小的整体来构成整个文档,采用基于词频的加权统计法判断全文的相似性。 展开更多
关键词 复制检测 文本指纹 词频
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部