基于生成式因果语言模型的水印嵌入与检测被引量：1

Watermark embedding and detection based on generative causal language model

下载PDF

导出

摘要基于人工智能内容生成(AIGC)技术生成文本具有道德、法律的合规性风险,需要对生成文本内容的流通进行规范和监管,因此对AIGC生成文本版权保护的迫切需求随之出现。水印技术是目前使用最广泛的数字版权保护方式。提出了一种应用于生成式因果语言模型的生成文本的水印添加技术,采用事中水印嵌入的方式在文本生成过程中隐式地嵌入文本水印特征编码,相较于传统事后水印添加技术对生成文本质量影响小,具有低感知、透明、鲁棒等优点。实验结果表明,提出的水印嵌入策略具有较好的鲁棒性,经过用户一定程度的编辑后仍旧能有效检出文本嵌入水印。与原有生成策略进行对比,所提方法与现有模型耦合度低,无须调整原有模型结构、训练策略、部署方式,不增加原有生成过程计算成本。 Artificial intelligence generated content(AIGC)generated text itself carried moral and legal compliance risks,and the circulation of generated text content need to be regulated.Therefore,there was an urgent need for copyright protection of AIGC generated text.Watermarking technology was currently the most widely used method for digital copyright protection.A watermark embedding technology was proposed for generating text using generative causal language models.An in-process watermark embedding method was adopted,which implicitly embeded text watermark during the text generation process.Compared to traditional post-process watermark embedding technology,it had less impact on the quality of generated text and had advantages such as low perception,transparency,and robustness.The proposed method has low coupling with existing models and can eliminate the need to adjust the original model structure,training strategies,deployment methods,and increase the computational cost of the original generation process.Through experimental results,the proposed watermark embedding strategy has good robustness and can effectively detect text embedded watermarks even after a certain degree of editing by users.

作者刘明录郑彦韩雪袁向阳邓超 LIU Minglu;ZHENG Yan;HAN Xue;YUAN Xiangyang;DENG Chao(China Mobile Research Institute,Beijing 100053,China)

机构地区中国移动通信有限公司研究院

出处《电信科学》 2023年第9期32-42,共11页 Telecommunications Science

关键词人工智能内容生成因果语言模型数字水印数字版权 AIGC generated causal language model digital watermark digital copyright

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1张震宇,李千目,戚湧.基于不可见字符的文本水印设计[J].南京理工大学学报,2017,41(4):405-411. 被引量：17
2傅瑜,王保保.文本水印附加空格编码方法的实现及其性能[J].长安大学学报（自然科学版）,2002,22(3):85-87. 被引量：16
3林建滨,何路,李天智,房鼎益.一种抗攻击的中文同义词替换文本水印算法[J].西北大学学报（自然科学版）,2010,40(3):433-436. 被引量：9
4张宇,刘挺,陈毅恒,赵世奇,李生.自然语言文本水印[J].中文信息学报,2005,19(1):56-62. 被引量：51
5周新民,孙星明,刘超.基于汉字结构知识的鲁棒性公开文本水印[J].计算机工程与应用,2006,42(8):165-167. 被引量：4
6王慧琴,李人厚.二值文本数字水印技术的研究与仿真[J].系统仿真学报,2004,16(3):521-524. 被引量：26
7刘豪,孙星明,刘晋飚.基于字体颜色的文本数字水印算法[J].计算机工程,2005,31(15):129-131. 被引量：31

二级参考文献47

1[1]Nikolardis N, Pitas I. Robust image watermarking in the spatial domain [J]. Signal Processing, 1998, 66(3): 385-403.
2[2]Shinfeng D Lin, Chin-Feng Chen. A robust DCT-based watermarking for copyright protection [J]. IEEE Transactions on Consumer Electronics, 2000, 46(3): 415-421.
3[3]Jiwu Huang, Yun Q Shi. Adaptive Image Watermarking Scheme Based on Visual Masking [J]. Electronics Letters, 1998, 16th: 748-750.
4[4]Steven H Low, Nicholas F Maxemchuk. Capacity of Text Marking Channel [J]. IEEE Signal Processing Letters, 2000, 7(12): 345-347.
5[5]Bender W, Gruhl D, Morimoto N, Lu A. Techniques for data hiding [J]. IBM Syst. 1996, 3: 215-218.
6[6]Brassil J, Low S, Maxemchuk N, O'Gorman L. Electronic marking and identification techniques to discourage document copying, IEEE J. Select. Areas Commun [J]. 1995, 13: 1122-1225.
7[7]Brassil J T, Low S H, Maxemchuk N F. Copyright Protection for the Electronic Distribution of Text Documents [J]. 1999, Proc. Ieee, 87: 1181-1196.
8[8]Lu H, Shi X, Shi Y Q, Kot A C, Chen L. Watermark embedding in DC components of DCT for binary images [C]. in proc. IEEE Int. Workshop on Multimedia Signal Processing, US Virgin Islands, 2002: 300-303.
9Katzenbeisser, S. C. Principles of Steganogtaphy. In: S. Katzenbeisser and F. A. P. Petitcolas(eds. ) ,Information Hiding[ C ]. Techniques for Steganography and Digital Watermarking. Boston: Artech, 2000,17- 41.
10Brassil, J., N. F. Maxemchuk, and L. O' Gonnan. Electronic Marking and Identification Technique to Discourage Document Copying[C] .Proceedings of INFOCOM '94,1994,1278- 1287.

共引文献129

1潘晓东.基于数字水印的PDF文档版权保护技术[J].科技资讯,2007,5(35):158-159. 被引量：3
2雷丽萍.一种基于自然语言的文本水印算法[J].贵阳学院学报（自然科学版）,2009,4(4):39-43. 被引量：2
3弋英民,李人厚,梅时春,党红梅.一种基于文本行和对角侧面特性的数字水印方法[J].小型微型计算机系统,2005,26(2):293-296. 被引量：8
4廖柯宇,李炳法,马增辉,曹冰,刘高峰.一种基于PDF文档的数字水印算法[J].现代计算机,2005,11(5):4-8. 被引量：6
5肖湘蓉,孙星明.基于内容的英文文本数字水印算法设计与实现[J].计算机工程,2005,31(22):29-31. 被引量：6
6冉文波,梁华庆.二值图像数字水印技术的研究进展[J].计算机工程与应用,2005,41(36):48-51. 被引量：7
7陈芳,王冰.基于文本字体的信息隐藏算法[J].计算机技术与发展,2006,16(1):20-22. 被引量：9
8方旺盛,舒明磊.一种基于特征编码的Word文档数字水印算法[J].科技广场,2006(1):4-6. 被引量：2
9舒后,何薇,齐亚莉.文本数字水印技术研究[J].北京印刷学院学报,2006,14(1):24-28. 被引量：4
10尹德辉,李炳法,唐燕.基于小波变换的融合算法研究[J].系统仿真学报,2006,18(5):1289-1291. 被引量：7

同被引文献1

1王一博,郭鑫,刘智锋,王继民.AI生成与学者撰写中文论文摘要的检测与差异性比较研究[J].情报杂志,2023,42(9):127-134. 被引量：8

引证文献1

1邓佳文,任福继.2023年生成式AI大模型发展热点回眸[J].科技导报,2024,42(1):266-285. 被引量：2

二级引证文献2

1张文娟,邓辉,艾政阳,唐彬.我国AI大模型数据集建设发展刍议[J].人工智能,2024(3):85-95. 被引量：1
2解学芳,曲晨.价值对齐:AIGC时代的人工智能文化科技伦理风险与精准共治路径研究[J].兰州大学学报（社会科学版）,2024,52(3):147-156.

1刘心雨.幼小衔接视域下小学数学课堂教学的生成策略[J].数学大世界（中旬）,2022(9):41-43.
2洞见[J].全媒体探索,2023(9):141-141.
3魏强,刘荣.用事实讲道理是新时代讲好思政课的鲜明要求[J].马克思主义理论教学与研究,2023(3):128-135.
4张蕾.无保护助产护理对产妇自然分娩的促进作用分析[J].中文科技期刊数据库（全文版）医药卫生,2023(10):83-86.
5姚晔,刘书辉,王慧,李琛璞,李黎.基于字符扰动变形和字库替换的鲁棒中文文本水印[J].密码学报,2023,10(4):769-785.
6赵鹏,王磊.基于改进遗传算法的无线通信网络资源分配方法[J].长江信息通信,2023,36(8):169-171. 被引量：2
7陈焱松.AIGC技术在人工智能电影创作中的应用策略研究[J].现代电影技术,2023(9):39-45. 被引量：6
8叶盛.福建广电网络集团OTN网建设及保护策略应用[J].广播电视网络,2023,30(9):51-54. 被引量：1
9翟年祥,赵怡.多元协同治理理论下幼鱼资源保护路径探索[J].绥化学院学报,2023,43(5):12-14.
10徐剑峰,陶铁铃,邹尤,王双,王晨晖.海上风电基础防腐蚀设计与应用[J].中国科技期刊数据库工业A,2023(10):116-120.

电信科学

2023年第9期

浏览历史

内容加载中请稍等...

基于生成式因果语言模型的水印嵌入与检测被引量：1

参考文献7

二级参考文献47

共引文献129

同被引文献1

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于生成式因果语言模型的水印嵌入与检测 被引量：1

参考文献7

二级参考文献47

共引文献129

同被引文献1

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于生成式因果语言模型的水印嵌入与检测被引量：1