期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种用于抄袭识别的文档距离度量 被引量:5
1
作者 胡明晓 DING Leon X 《计算机工程与应用》 CSCD 北大核心 2010年第7期148-152,177,共6页
广义编辑距离的计算是一个NP-完全问题,在充分考虑了文档抄袭行为的特点之后提出一种基于广义编辑距离的单向的低计算复杂性的文档距离度量方法。首先,计算第一文档的各段落在第二文档全文中的近似串匹配距离之和,同时确定各段落在第二... 广义编辑距离的计算是一个NP-完全问题,在充分考虑了文档抄袭行为的特点之后提出一种基于广义编辑距离的单向的低计算复杂性的文档距离度量方法。首先,计算第一文档的各段落在第二文档全文中的近似串匹配距离之和,同时确定各段落在第二文档中的近似匹配子串(即原象串),然后根据这些原象串得到回退数和前跳数,最后将三者求和作为文档距离。该文档距离是一种广义编辑距离的近似值,能够在O(n2)时间内计算,并能充分反映抄袭方向。针对人工文档和实际文档的两组实验表明该距离具有较低的漏检率、误检率。 展开更多
关键词 文档距离 广义编辑距离 近似串匹配 抄袭识别 电子文档管理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部