抄袭剽窃论文识别研究综述被引量：7

Literature Review on Copy and Plagiarism Detections

下载PDF

导出

摘要抄袭剽窃论文的识别是知识产权保护中一项重要的内容,已有众多的识别方法和系统.本文从抄袭剽窃的定义、文本的表示（向量空间模型、广义向量空间模型、隐性语义索引模型）、文本相似度的研究内容、文本相似度的计算方法（基于统计学的计算方法和基于语义理解的计算方法）、数字指纹和词频统计两大类技术和方法和抄袭剽窃识别系统等方面为基本思路,对该领域中已提出的主要研究方案进行了分类阐述和比较分析,总结了其最新研究进展,为下一步的研究提出了新的课题和设想. Copy and plagiarism detection is emerging as one of the primary research areas in intellectual property protection. Many plagiarism detection methods and systems have been proposed. The paper summaries this research field from some points of view, such as the definition of copy and plagiarism, text representation（ such as, Vector Space Model, Generalized Vector Space Model, Latent Semantic Index）, research content of text similarity, computation method of text similarity（ such as one computation method based on statistics, another computation method based on semantic comprehension）, the two main techniques and methods, namely, finger printing and word frequency, and detection systems. At the end of the paper, some difficulties have to overcome in the future are pointed out, and directions to study are given.

作者易彤徐升华万常选吴方君

机构地区江西财经大学信息管理学院

出处《情报学报》 CSSCI 北大核心 2007年第4期567-573,共7页 Journal of the China Society for Scientific and Technical Information

基金江西省自然科学基金项目（程序切片技术在软件形式化中的应用）、江西省教育科学＂十一五＂规划重点课题（江西高校科研竞争力评价体系的研究）、江西省社会科学＂十一五＂规划课题（学校内部科研成果创新性评价及对应管理体制改革研究）和江西财经大学校级课题（程序切片技术在软件形式化

关键词剽窃检测数字指纹词频统计 plagiarism detection, finger printing, word frequency

分类号 G322 [文化科学]

引文网络
相关文献

参考文献42

1鲍军鹏,沈钧毅,刘晓东,宋擒豹.自然语言文档复制检测研究综述[J].软件学报,2003,14(10):1753-1760. 被引量：69
2Salton G.Automatic text processing:the transformation analysis,and retrieval of information by computer.Addison-Wesley Longman Publishing Co.,Inc.Boston,MA,USA,1989.
3Wong S K M,Ziarko W,Wong P C N.Generalized vector space model in information retrieval.Proceedings of the 8th Annual ACM SIGIR International Conference on Research and Development in Information Retrieval,1985:18-25.
4Deerwester S,Dumais S T,Furnas G W,Landauer T K,Harshman R.Indexing by latent semantic analysis.Journal of the Society for Information Science,1990,41(6):391-407
5Li Qin,Vijayalakshmi Atluri.An ontology-guided approach to change detection of the semantic web data.Journal on Data Semantics,2006,(5):130-157.
6Nicki Hitchcott.Calixthe Beyala:prizes,plagiarism,and "authenticity".Research in African Literatures,2006,37(1):100-110.
7Ottenstein K J.An algorithmic approach to the detection and prevention of plagiarism.ACM SIGCSE Bulletin,1976,8 (4):30-41.
8Clough P.Plagiarism in natural and programming languages:an overview of current tools and technologies.Research Memoranda:CS-00-05,Department of Computer Science,University of Sheffield,2000.
9Broder A Z.On the resemblance and containment of documents.Proceedings of Compression and Complexity of Sequences.Salerno:IEEE Computer Society,1997:21-29.
10Callan J P.Passage-level evidence in document retrieval.Proceedings of the 17th annual International ACM SIGIR conference on Research and development in information retrieval.Dublin,Ireland,1994:302-310.

二级参考文献93

1董振东,董强.面向信息处理的词汇语义研究中的若干问题[J].语言文字应用,2001(3):27-32. 被引量：35
2史彦军,滕弘飞,金博.抄袭论文识别研究与进展[J].大连理工大学学报,2005,45(1):50-57. 被引量：36
3宋擒豹.电子商务环境下的数据挖掘研究：博士学位论文[M].西安:西安交通大学,2001..
4穗志文.基于骨架依存树的语句相似度计算模型[J].计算语言学文集,1998,(3):176-184.
5[2]Griswold G N. A method for protecting copyright on networks. In: Proc of Joint Harvard MIT Workshop on Technology Strategies for Protecting Intellectual Property in the Networked Multimedia Environment. Cambridge, MA: MIT Press, 1993. 214～221
6[3]Brassil J, Low S, Maxemchuk N et al. Document marking and identification using both line and word shifting. AT & T Bell Laboratories, Tech Rep: TR94.6.8, 1994
7[4]JPEG. JPEG digital compression and coding of continuous still images. ISO, Draft, Tech Rep: ISO 10918, 1991
8[5]Brin S, Davis J, Garciaolina H. Copy detection mechanisms for digital documents. In: Proc of the ACM SIGMOD Int'l Conf on Management of Data. San Francisco, CA: ACM Press, 1995. 398～409
9[1]Popek G J, Kline C S. Encryption and secure computer networks. ACM Computing Surveys, 1979, 11(4): 331～356
10[1]DONALD L M C. CAI research [EB/OL]. http:∥www.academicintegrity.org/cairesearch.asp., 2004-07-01.

共引文献439

1贾善崇,周兰江,张建安,周枫.融入多特征的汉-老双语对齐方法[J].中国水运（下半月）,2020,20(3):78-80. 被引量：2
2王常亮,闫利华,吴曦德.基于XML的智能答疑系统研究[J].赤峰学院学报（自然科学版）,2008,24(9):86-89.
3周粉,夏幼明.一种改进的基于知网的语义相似度计算方法[J].云南大学学报（自然科学版）,2008,30(S2):215-218. 被引量：1
4卢小康,王小华,王荣波.一种句子级别的中文文本复制检测方法[J].杭州电子科技大学学报（自然科学版）,2009,29(6):45-48. 被引量：1
5赵蔚.已发论文检测分析报告的权重系数设定[J].浙江海洋学院学报（人文科学版）,2012,29(2):100-103. 被引量：1
6彭京,杨冬青,唐世渭,王腾蛟,高军.基于概念相似度的文本相似计算[J].中国科学（F辑:信息科学）,2009,39(5):534-544. 被引量：17
7王雯,廖祥忠.数字图像作品抄袭鉴定研究[J].大连理工大学学报,2011,51(S1):98-101.
8王小华,卢小康.基于N-Gram的文本去重方法研究[J].杭州电子科技大学学报（自然科学版）,2010,30(2):61-64. 被引量：5
9耿艳辉,王立新,朱晓华.期刊同行评议研究综述[J].编辑之友,2015(5):48-52. 被引量：13
10张蒲生,苏运霖,方德葵.同时嵌入数字许可和版权标识的版权控制方案[J].计算机工程与应用,2004,40(25):213-217.

同被引文献72

1史成娣.论“学术不端文献检测系统”在编辑工作中的应用——以“科技期刊学术不端文献检测系统”为例[J].南昌教育学院学报,2009,24(4):82-84. 被引量：19
2刘可静.当前我国文献信息交流中的知识产权保护问题[J].华中师范大学学报（人文社会科学版）,1999,38(4):74-78. 被引量：7
3王毅.论抄袭的认定[J].法商研究,1997,15(5):63-66. 被引量：17
4江新华.美国大学防剽窃教育的主要特点及其启示[J].比较教育研究,2004,25(7):68-72. 被引量：14
5陈桥驿.论学术腐败[J].学术界,2004(5):132-141. 被引量：7
6史彦军,滕弘飞,金博.抄袭论文识别研究与进展[J].大连理工大学学报,2005,45(1):50-57. 被引量：36
7周祥森.从“张爱民博士论文抄袭”案看中国世界史研究的困境[J].社会科学论坛,2005(3):47-51. 被引量：4
8王军丽.推进著作权的合理使用:美国的规范与现状[J].图书馆建设,2005(3):18-20. 被引量：5
9浦庆余.规范科技评价净化学术环境[J].学会,2005(7):33-35. 被引量：5
10何朝晖.英语学术界的若干论著体例及其启示——对建立中文学术规范体系的思考[J].大学图书馆学报,2005,23(4):83-88. 被引量：8

引证文献7

1周英智,李伟,孙瑶,靳光华.初审中利用数据库检索论文抄袭行为[J].编辑学报,2008,20(4):319-320. 被引量：27
2秦珂,尤太生.抄袭、剽窃的判断与法律责任[J].图书与情报,2008(5):68-71. 被引量：8
3许姝韫.论科技论文中的一种隐性剽窃[J].编辑学报,2009,21(2):147-148. 被引量：4
4王森,王宇.基于文本结构树的论文复制检测算法[J].现代图书情报技术,2009(10):50-55. 被引量：4
5凌锋,潘薇,杨康.学术抄袭行为的防治研究探讨[J].情报杂志,2011,30(B06):25-29. 被引量：1
6李家永,耿艳辉,张戈丽.《资源科学》自由来稿的文字复制状况分析[J].中国科技期刊研究,2012,23(2):256-260. 被引量：6
7武昱,石朝云.与科技期刊著作权相关的三则案例探讨[J].中国科技期刊研究,2014,25(8):1048-1051. 被引量：6

二级引证文献56

1庞海波.“三核七查”法在生物医学论文初审阶段学术不端行为防范中的应用[J].编辑学报,2023,35(1):77-81. 被引量：3
2陈茂国.图书馆征文活动中抄袭现象的剖析[J].浙江高校图书情报工作,2009(6):6-9.
3侯丽珊.编辑部如何在遏制学术不端中发挥作用[J].编辑学报,2010,22(S1):11-13. 被引量：4
4甘艳.学术不端检测系统在医学科技核心期刊初审稿件中应用价值研究[J].传播与版权,2014(3):48-49. 被引量：5
5耿艳辉,王立新,朱晓华.期刊同行评议研究综述[J].编辑之友,2015(5):48-52. 被引量：13
6鲁翠涛,赵应征.医学期刊稿件编辑加工整理应注意的问题[J].中国科技期刊研究,2009,20(4):742-744. 被引量：4
7郭世平,罗季重,张永军.中学数学教育教学类期刊选稿思考[J].合肥学院学报（社会科学版）,2009,26(5):127-130.
8高琦,杨再国.编辑部如何防止论文抄袭[J].四川省卫生管理干部学院学报,2009,28(2):177-178. 被引量：1
9孔琪颖,蔡斐,张利平,徐晓.正确看待“科技期刊学术不端文献检测系统”检测结果[J].编辑学报,2009,21(6):544-546. 被引量：63
10文玉珊.科技期刊论文的变异重复发表及应对策略[J].湘潭师范学院学报（自然科学版）,2009,31(4):147-148.

1徐惠萍.数字指纹与数字水印技术的比较及其在版权保护中的应用[J].内蒙古科技与经济,2010(13):59-60.
2杭月霞,李琦.新闻媒体行业基本现状[J].消费导刊,2008,0(18):229-229.
3范桂红,迟健光.企业档案部门构建学习型组织的系统模型[J].云南档案,2011(2):60-61.
4赵俊杰.学术论文抄袭检测方法研究综述[J].湖南工业大学学报（社会科学版）,2010,15(1):157-159. 被引量：3
5张绍武.数字指纹及其在数字作品版权保护中的应用[J].情报杂志,2004,23(10):64-65. 被引量：2
6马景娣.《EI Compendex》收录论文的正确识别[J].中国索引,2003,1(4):37-41. 被引量：1
7张绍武.版权标记技术及其前景展望[J].图书情报工作,2004,48(7):86-89.
8刘世贵.数字指纹水印技术在卫星电视广播的应用[J].视听界（广播电视技术）,2013(3):55-57.
9图书馆、情报与文献学——情报学[J].中国学术期刊文摘,2007,13(24):9-9.
10安徽省数字版权保护平台正式上线[J].印刷质量与标准化,2014,0(7):7-7.

情报学报

2007年第4期

浏览历史

内容加载中请稍等...

抄袭剽窃论文识别研究综述被引量：7

参考文献42

二级参考文献93

共引文献439

同被引文献72

引证文献7

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

抄袭剽窃论文识别研究综述 被引量：7

参考文献42

二级参考文献93

共引文献439

同被引文献72

引证文献7

二级引证文献56

相关作者

相关机构

相关主题

浏览历史

抄袭剽窃论文识别研究综述被引量：7