期刊文献+

中文文本抄袭检查技术的研究

Research on the Chinese Text Plagiarism Checker
下载PDF
导出
摘要 该文介绍了一种基于字符串匹配的中文文本抄袭检测方法——k-grams算法,并指出了选取常用语句降低了其判别的准确性。提出了利用基于统计的中文分词技术实现对k-grams算法的改良。实验结果表明改良后的算法判断抄袭的准确性得到了提高。 该文介绍了一种基于字符串匹配的中文文本抄袭检测方法——k-grams算法,并指出了选取常用语句降低了其判别的准确性。提出了利用基于统计的中文分词技术实现对k-grams算法的改良。实验结果表明改良后的算法判断抄袭的准确性得到了提高。
出处 《杭州电子科技大学学报(自然科学版)》 2010年第5期117-120,共4页 Journal of Hangzhou Dianzi University:Natural Sciences
基金 浙江省科技计划重点资助项目(C31066) 浙江工商大学校级学生创新重点资助项目(1120XJ1709198)
关键词 抄袭检查 中文文本 中文分词 plagiarism checking Chinese document Chinese word segmentation
  • 相关文献

参考文献2

二级参考文献12

  • 1金博,史彦军,滕弘飞.基于语义理解的文本相似度算法[J].大连理工大学学报,2005,45(2):291-297. 被引量:79
  • 2黄丽琼,何中市.基于统计语义和结构特征的自动文摘[J].广西师范大学学报(自然科学版),2006,24(4):187-190. 被引量:8
  • 3金博,史彦军,滕弘飞.基于篇章结构相似度的复制检测算法[J].大连理工大学学报,2007,47(1):125-130. 被引量:28
  • 4GARCIA-MOLINA H, SHIVAKUMAR N. SCAM: a copy detection mechanism for libraries[C]//Proceedings of 2nd International Conference in Theory and Practice of Digital Libraries. Austin;Texas :ACM Press, 1995:11-13.
  • 5MONOSTORI K, ZASLAVSKY A. Match detect reveal: finding overlapping and similar digital documents[C]//Proceedings of the Information Resources Management Association International Conference (IRMA2000). Hershey: IGI, 2000:955-957.
  • 6SCHLEIMER S, WILKERSOND S. Winnowing: local algorithms for document fingerprinting[C]//ACM SIGMOD 2003. San Diego ACM Press, 2003:204-212.
  • 7Richard M Karp, Michael O Rabin. Efficient randomized patternmatching algorithms [J]. IBM Journal of Research and Development, 1987,31 (2): 249-260.
  • 8Karen Jullam, Jisun Park. Improvements for scalable and accurate plagiarism detection in digital documents [J]. Data Mining and Knowledge Discovery, 2002,7 (3): 218-223.
  • 9董振东,董强.知网[EB/OL].http://keenage.com/zhiwang/c_zhiwang.html.
  • 10麻会东,刘国华,李旭,梁鹏,刘春辉,张凌宇.基于提取关键词的中文文档复制检测研究[J].计算机工程与科学,2007,29(10):63-64. 被引量:6

共引文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部