期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
针对同义词替换信息隐藏的检测方法研究 被引量:9
1
作者 罗纲 孙星明 +2 位作者 向凌云 刘玉玲 甘灿 《计算机研究与发展》 EI CSCD 北大核心 2008年第10期1696-1703,共8页
基于同义词替换的文本信息隐藏方法,可以通过对载体中的同义词进行有选择的替换来嵌入隐藏信息.通过分析,发现这种方法嵌入隐藏信息后会导致载体文本中同义词结对概率的明显增加.基于此,提出了一种通过分析文本中同义词结对值来进行隐... 基于同义词替换的文本信息隐藏方法,可以通过对载体中的同义词进行有选择的替换来嵌入隐藏信息.通过分析,发现这种方法嵌入隐藏信息后会导致载体文本中同义词结对概率的明显增加.基于此,提出了一种通过分析文本中同义词结对值来进行隐藏信息检测的算法.实验表明,该检测算法漏警率约为4%,虚警率约为9.8%,证明该检测算法可以有效地检测基于同义词替换的文本信息隐藏方法隐藏的信息. 展开更多
关键词 信息隐藏 隐写分析 同义词结对 同义词替换 文本
下载PDF
编码与同义词替换结合的可逆文本水印算法 被引量:7
2
作者 林新建 唐向宏 王静 《中文信息学报》 CSCD 北大核心 2015年第4期151-158,198,共9页
从通信编码的角度,该文探讨一种利用编码方法和同义词替换相结合的可逆文本篡改检测水印算法。以可替换同义词为标志对文本进行分组,提取分组文本特征生成认证水印信息;利用霍夫曼编码和纠错编码对同义词库各词进行编码,利用同义词替换... 从通信编码的角度,该文探讨一种利用编码方法和同义词替换相结合的可逆文本篡改检测水印算法。以可替换同义词为标志对文本进行分组,提取分组文本特征生成认证水印信息;利用霍夫曼编码和纠错编码对同义词库各词进行编码,利用同义词替换技术完成水印的嵌入。在接收端,利用分组文本特征和霍夫曼编码,实现水印文本的篡改定位,利用纠错码实现可替换同义词的还原恢复。仿真实验表明,算法嵌入的水印具有良好的不可见性和较强的鲁棒性,在实现对文本篡改定位的同时,较好地实现了可替换同义词无损还原。 展开更多
关键词 编码 同义词替换 可逆文本水印 定位篡改
下载PDF
基于矩阵编码的同义词替换隐写算法 被引量:11
3
作者 杨潇 李峰 向凌云 《小型微型计算机系统》 CSCD 北大核心 2015年第6期1296-1300,共5页
采用一般同义词替换方法嵌入秘密信息时,需要对载体文本做较多修改,使得改写率较高,秘密信息的安全性降低.针对该缺点,设计了一种矩阵编码与同义词替换结合的信息隐藏方法,此方法首先按照一定规则编码将载体同义词数值化,然后利用矩阵... 采用一般同义词替换方法嵌入秘密信息时,需要对载体文本做较多修改,使得改写率较高,秘密信息的安全性降低.针对该缺点,设计了一种矩阵编码与同义词替换结合的信息隐藏方法,此方法首先按照一定规则编码将载体同义词数值化,然后利用矩阵编码可以降低载体改写率,根据待嵌入的秘密信息,对载体同义词分组进行矩阵编码来实现信息的嵌入.实验结果表明,采用基于矩阵编码的同义词替换隐写方法有利于提高嵌入效率,降低隐写文本被统计分析检测到的可能性,从而提高秘密信息的安全性. 展开更多
关键词 矩阵编码 同义词替换 隐写 嵌入效率
下载PDF
基于字符特征与同义词替换结合的文本隐写方法 被引量:3
4
作者 高全胜 王开西 《青岛大学学报(自然科学版)》 CAS 2018年第2期63-66,74,共5页
同义词替换等修改式隐写算法需要修改原始文本,容易因用词上下文不匹配而被识别,生成法等无载体隐写因受限于自然语言理解技术还无法完全实现语句上下文通顺。从均衡安全性和可用性的角度出发,在传统同义词替换方法的基础上,提出一种利... 同义词替换等修改式隐写算法需要修改原始文本,容易因用词上下文不匹配而被识别,生成法等无载体隐写因受限于自然语言理解技术还无法完全实现语句上下文通顺。从均衡安全性和可用性的角度出发,在传统同义词替换方法的基础上,提出一种利用字符基本特征与同义词替换相结合的文本隐藏方法,将秘密信息的二进制位用字符特征表示,把秘密信息的位置信息通过同义词替换标识。实验结果表明,该方法具有较好的可实现性,同时通过对字符特征的选择和改变可有效实现隐写安全性,并具有灵活性且在隐蔽性方面有一定的改进,可以与即时通信结合,设计的对话拥有较大的隐藏容量。 展开更多
关键词 隐写术 自然语言处理 同义词集编码 同义词替换
下载PDF
基于BERT的垃圾邮件分类的同义词替换攻击研究
5
作者 林小题 秦玉海 于昕彤 《网络安全技术与应用》 2024年第4期45-48,共4页
电子邮件在办公应用中有其独特的优势,但电子邮件在应用过程中也被一些人通过广告邮件推送的方式进行牟利,这些广告邮件也称为垃圾邮件。为了阻断垃圾邮件,邮箱管理者经常采用垃圾邮件分类的方法对其进行管理。但垃圾邮件推送者为了绕... 电子邮件在办公应用中有其独特的优势,但电子邮件在应用过程中也被一些人通过广告邮件推送的方式进行牟利,这些广告邮件也称为垃圾邮件。为了阻断垃圾邮件,邮箱管理者经常采用垃圾邮件分类的方法对其进行管理。但垃圾邮件推送者为了绕过邮件分类器,采取了同义词替换攻击的方法。本文通过使用SMS垃圾邮件的数据集,进行文本预处理和分类后,建立了根据从数据集中提取5000个最常见词语的词汇表,并将它们用作同义词库中的关键词。随后分别使用文本表示模型BoW、TF-IDF和新的BERT模型,结合SVM、朴素贝叶斯、决策树算法,对同义词替换攻击检测。经比对分析,结果表明BoW和TF-IDF检测率急剧下降,而BERT模型能够抵抗同义词替换攻击。 展开更多
关键词 垃圾邮件分类 同义词替换攻击 BERT模型
原文传递
基于同义词数据增强的汉越神经机器翻译方法 被引量:8
6
作者 尤丛丛 高盛祥 +2 位作者 余正涛 毛存礼 潘润海 《计算机工程与科学》 CSCD 北大核心 2021年第8期1497-1502,共6页
汉越平行语料库的资源稀缺,很大程度上影响了汉越机器翻译效果。数据增强是提升汉越机器翻译的有效途径,基于双语词典的词汇替换数据增强是当前较为流行的方法。由于汉语-越南语属于低资源语言对,双语词典难以获得,而通过单语词向量获... 汉越平行语料库的资源稀缺,很大程度上影响了汉越机器翻译效果。数据增强是提升汉越机器翻译的有效途径,基于双语词典的词汇替换数据增强是当前较为流行的方法。由于汉语-越南语属于低资源语言对,双语词典难以获得,而通过单语词向量获取低频词的同义词较为容易。因此,提出一种基于低频词的同义词替换的数据增强方法。该方法利用小规模的平行语料,首先通过对单语词向量的学习,获得一端语言低频词的同义词列表;然后对低频词进行同义词替换,再利用语言模型对替换后的句子进行筛选;最后将筛选后的句子与另一端语言中的句子进行匹配,获得扩展的平行语料。汉越翻译对比实验结果表明,提出的方法取得了很好的效果,扩展后的方法比基准和回译方法在BLEU值上分别提高了1.8和1.1。 展开更多
关键词 汉越 数据增强 同义词替换 神经机器翻译
下载PDF
一种基于低失真替换优先的文本隐写算法 被引量:1
7
作者 向凌云 胡毅君 王伟征 《计算机工程与应用》 CSCD 北大核心 2015年第15期102-106,共5页
针对同义词替换操作造成原始文本整体统计特性的破坏,提出了一种基于低失真替换优先的文本隐写算法。该算法以同义词在文本中的合适度为基础,构造失真函数衡量同义词替换后文本统计特性的改变程度;不仅为每个同义的词集合选取合适度最... 针对同义词替换操作造成原始文本整体统计特性的破坏,提出了一种基于低失真替换优先的文本隐写算法。该算法以同义词在文本中的合适度为基础,构造失真函数衡量同义词替换后文本统计特性的改变程度;不仅为每个同义的词集合选取合适度最高的两个词组成替换组合,而且从全局的角度出发,对原始文本中的所有同义词替换组合所引起的失真度进行排序,优先选取失真度小的同义词替换组合来嵌入信息,从而降低了同义词序列统计特性的改变程度。实验结果表明,该算法可以很好地抵抗基于同义词结对和基于同义词相对词频统计特征的隐藏信息检测算法的攻击,具有较高的抗检测能力,提高了秘密信息的安全性。 展开更多
关键词 文本隐写 同义词替换 失真函数 隐写分析
下载PDF
基于改进K-means聚类的在线新闻评论主题抽取 被引量:15
8
作者 夏火松 李保国 杨培 《情报学报》 CSSCI 北大核心 2016年第1期55-65,共11页
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先... 新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先在预处理阶段增加同义词替换和自动构建领域词典的部分,改善了数据稀疏性和高维性。其次,提出了K-means改进算法,用隐藏长评论-最大距离法选初始点,解决了初始点多为离群点的问题,用方差拐点确定K值,解决了预先设定聚类个数的问题,实验发现了先用BW权重选初始点,再用新提出的BW-DF权重聚类的效果最好。最后,将改进算法与原算法的聚类效果比较,实验结果表明,改进算法准确率高,抽取新闻评论主题的效果明显。 展开更多
关键词 在线新闻评论 K—means聚类改进 主题抽取 同义词替换 分词领域词典
下载PDF
融合多策略数据增强的低资源依存句法分析方法 被引量:6
9
作者 线岩团 高凡雅 +2 位作者 相艳 余正涛 王剑 《计算机科学》 CSCD 北大核心 2022年第1期73-79,共7页
依存句法分析旨在识别句子中词与词之间的句法依赖关系。依存句法能为信息抽取、自动问答和机器翻译等任务提供句法特征,提高模型性能。训练数据规模对依存句法分析模型的性能具有重要影响,训练数据的缺乏会带来严重的未知词问题和模型... 依存句法分析旨在识别句子中词与词之间的句法依赖关系。依存句法能为信息抽取、自动问答和机器翻译等任务提供句法特征,提高模型性能。训练数据规模对依存句法分析模型的性能具有重要影响,训练数据的缺乏会带来严重的未知词问题和模型过拟合问题。文中针对低资源依存句法分析问题,提出了多种数据增强策略。所提方法通过同义词替换有效扩充了训练数据,缓解了未知词问题。通过多种Mixup的数据增强策略,有效缓解了模型过拟合问题,提高了模型的泛化能力。在(Universal Dependencies treebanks,UD treebanks)数据集上的实验结果表明,所提方法有效提升了小规模训练语料条件下泰语、越南语和英语依存句法分析的性能。 展开更多
关键词 依存句法分析 低资源语言 Mixup数据增强 同义词替换 多策略
下载PDF
基于双文本段的信息隐藏算法 被引量:5
10
作者 陈志立 黄刘生 +2 位作者 余振山 杨威 陈国良 《电子与信息学报》 EI CSCD 北大核心 2009年第11期2725-2730,共6页
信息隐藏是一种在传输或存储过程中将隐秘信息隐藏在特定载体中,以保证隐秘信息安全性的技术。常用的载体有图像、音频、视频、文本等类型文档。由于文本文档特别是纯文本文档中的冗余信息非常少,基于纯文本文档的信息隐藏具有很大的挑... 信息隐藏是一种在传输或存储过程中将隐秘信息隐藏在特定载体中,以保证隐秘信息安全性的技术。常用的载体有图像、音频、视频、文本等类型文档。由于文本文档特别是纯文本文档中的冗余信息非常少,基于纯文本文档的信息隐藏具有很大的挑战性。现存的基于纯文本文档的算法都是基于单文本段的,在安全性方面还存在许多难以克服的缺陷。该文提出了一种新的基于双文本段的信息隐藏算法,通过在多种隐藏形式中选择适当的隐藏形式和信息分散存储,大大地提高信息隐藏的隐蔽性、安全性。另外,算法具有很高的灵活度,可以根据具体的应用情景进行适当的变形或调整,以便更好地适用于实际需求。 展开更多
关键词 信息隐藏 同义词替换 双文本段 异或分解
下载PDF
基于语义水印的数字签名算法 被引量:3
11
作者 程显毅 张启杰 耿飙 《计算机应用研究》 CSCD 北大核心 2009年第10期3914-3917,共4页
针对数字签名技术中签名信息易被移除的问题,在语义技术的基础上提出了基于语义水印的数字签名算法。该算法的基本思想是在不改变文本语义的前提下,通过同义词替换算法嵌入签名信息,并在数据加密阶段,综合运用DES算法和RSA算法,使得破... 针对数字签名技术中签名信息易被移除的问题,在语义技术的基础上提出了基于语义水印的数字签名算法。该算法的基本思想是在不改变文本语义的前提下,通过同义词替换算法嵌入签名信息,并在数据加密阶段,综合运用DES算法和RSA算法,使得破解及窜改签名信息更加困难。实验证明,该算法具有容易实现、鲁棒性好、抗检测性强的优点。 展开更多
关键词 数字签名 同义词替换 语义 数据加密标准算法 RSA算法
下载PDF
基于词性分析的产品评价信息挖掘 被引量:4
12
作者 冯秀珍 郝鹏 《计算机工程与设计》 CSCD 北大核心 2013年第1期283-288,共6页
在对语料库中表达产品特征及相应评价的词的词性进行分析的基础上,确定了表达产品特征及评价最为常见的词性和词性的重要程度顺序,提出了一种产品特征及其相应评价的信息抽取规则,并根据规则建立评价语句的语义倾向的计算公式。实验结... 在对语料库中表达产品特征及相应评价的词的词性进行分析的基础上,确定了表达产品特征及评价最为常见的词性和词性的重要程度顺序,提出了一种产品特征及其相应评价的信息抽取规则,并根据规则建立评价语句的语义倾向的计算公式。实验结果表明,该方法在产品特征抽取及其相应评价的语义倾向判断上具有很高的准确性。通过对产品特征及其相应的评价信息进行挖掘可以为企业新产品的开发和产品的推荐提供重要的参考价值,是进行下一步生产决策的重要的理论依据。 展开更多
关键词 抽取规则 分词 语义倾向 同义词替换 信息挖掘
下载PDF
一种文本信息隐藏中的语法检测算法 被引量:4
13
作者 付敏 戴祖旭 胡文涛 《科学技术与工程》 北大核心 2015年第21期142-145,共4页
基于文本的信息隐藏方法是通过对大量汉语句子进行考察和结构分析,抽出以关键词为核心的改写模板,对具有一定结构特点的语句改写。但是经过同义词替换后可能会破坏句子的语言一致性。针对这一缺点,提出了一种语法检测的算法。首先根据... 基于文本的信息隐藏方法是通过对大量汉语句子进行考察和结构分析,抽出以关键词为核心的改写模板,对具有一定结构特点的语句改写。但是经过同义词替换后可能会破坏句子的语言一致性。针对这一缺点,提出了一种语法检测的算法。首先根据语法库统计出词性的可选搭配对进行词性搭配检测是否合理,再检测词语属性的搭配,最后决定是否对词本身有要求进行检测。在C平台下的数值实验表明该检测算法能够有效的处理文本信息隐藏。 展开更多
关键词 同义词替换 信息隐藏 汉语知识库 语法检测
下载PDF
一种基于纠错编码的可逆文本水印算法 被引量:1
14
作者 林新建 唐向宏 王静 《计算机应用与软件》 CSCD 2015年第1期303-308,共6页
针对现有可逆文本水印抗同义词替换攻击鲁棒性不强的缺点,提出一种基于纠错编码的可逆文本水印算法。利用纠错编码方法,对同义词库中同义词的位置进行编码生成同义词词码字,结合同义词替换技术完成水印的嵌入;在提取水印时,利用纠错码... 针对现有可逆文本水印抗同义词替换攻击鲁棒性不强的缺点,提出一种基于纠错编码的可逆文本水印算法。利用纠错编码方法,对同义词库中同义词的位置进行编码生成同义词词码字,结合同义词替换技术完成水印的嵌入;在提取水印时,利用纠错码的检测纠错功能完成水印的提取,同时实现同义词替换后可还原的可逆文本水印功能。仿真实验表明,算法嵌入的水印具有良好的不可见性和较强的鲁棒性。 展开更多
关键词 可逆文本水印 同义词替换 鲁棒性 纠错编码
下载PDF
可逆文本水印算法研究
15
作者 姜传贤 程小辉 《计算机工程》 CAS CSCD 2012年第19期126-128,146,共4页
提出一种可逆文本水印算法。该算法对文本特征进行分析,以确定待嵌入文本句子集,根据文本句子的奇偶性,利用同义词替换评价模型将水印不可感知地嵌入到原始文本中,通过调整算法参数,满足不同的鲁棒性和不可见性需求。仿真实验结果表明,... 提出一种可逆文本水印算法。该算法对文本特征进行分析,以确定待嵌入文本句子集,根据文本句子的奇偶性,利用同义词替换评价模型将水印不可感知地嵌入到原始文本中,通过调整算法参数,满足不同的鲁棒性和不可见性需求。仿真实验结果表明,该算法具有较好的不可见性,并能在提取水印后无损地恢复原始文本载体数据。 展开更多
关键词 文本水印 可逆水印 水印嵌入 水印提取 同义词替换 不可见性
下载PDF
基于Word2vec的自然语言隐写分析方法 被引量:6
16
作者 喻靖民 向凌云 曾道建 《计算机工程》 CAS CSCD 北大核心 2019年第3期309-314,共6页
为数字化表示文本内容的语义信息,并提高基于同义词替换的隐写文本检测精度,提出一种新的自然语言隐写分析方法。利用Word2vec对大规模语料库进行训练获得包含丰富语义信息的多维词向量,使用同义词及其上下文词向量之间的余弦距离度量2... 为数字化表示文本内容的语义信息,并提高基于同义词替换的隐写文本检测精度,提出一种新的自然语言隐写分析方法。利用Word2vec对大规模语料库进行训练获得包含丰富语义信息的多维词向量,使用同义词及其上下文词向量之间的余弦距离度量2个词之间的相关度,并计算同义词在特定上下文中的合适度。根据信息嵌入过程中同义词替换操作对文本同义词合适度的影响提取检测特征形成特征向量,采用贝叶斯分类模型训练特征向量得到隐写分析特征,从而识别隐写文本。实验结果表明,该方法对于不同嵌入率下隐写文本的平均检测精确率和召回率分别达到97.71%和92.64%,具有较好的检测性能。 展开更多
关键词 自然语言 词向量 同义词替换 隐写分析 上下文合适度
下载PDF
基于汉明码的文本可逆数字水印研究 被引量:2
17
作者 蒋策 彭建 +1 位作者 向凌云 李峰 《计算机工程与应用》 CSCD 北大核心 2016年第11期84-87,118,共5页
提出了一种新颖的文本可逆数字水印算法。对载体文本进行预处理,将原始可替换同义词的编码值分组作为信息位进行汉明编码,将获得的监督码元比特流利用矩阵编码的方式通过插入空格嵌入到文本中。水印信息则分组利用同义词修改位置编码的... 提出了一种新颖的文本可逆数字水印算法。对载体文本进行预处理,将原始可替换同义词的编码值分组作为信息位进行汉明编码,将获得的监督码元比特流利用矩阵编码的方式通过插入空格嵌入到文本中。水印信息则分组利用同义词修改位置编码的方式选定同义词进行替换来实现嵌入。在提取时利用汉明码的译码原理与可替换同义词分组位置编码规则,提取出水印信息并对原始文本进行无损恢复,即实现了文本可逆数字水印。该算法不仅能有效恢复出原始文本,且具有良好的隐蔽性,增强了水印方案的实际应用能力。 展开更多
关键词 汉明码 矩阵编码 同义词替换 可逆数字水印
下载PDF
混沌文本零水印的词法主动攻击 被引量:1
18
作者 李婧 房鼎益 何路 《计算机应用》 CSCD 北大核心 2012年第9期2603-2605,共3页
为了解决传统的密写分析技术对文本零水印失效的问题,提出一种基于词法的主动攻击算法。该算法将目前鲁棒性较好的混沌文本零水印作为攻击对象,采用同义词替换技术,定义了同步攻击和生日攻击两种方法,通过将这两种方法相结合,在词这一... 为了解决传统的密写分析技术对文本零水印失效的问题,提出一种基于词法的主动攻击算法。该算法将目前鲁棒性较好的混沌文本零水印作为攻击对象,采用同义词替换技术,定义了同步攻击和生日攻击两种方法,通过将这两种方法相结合,在词这一级别上实现了对文本零水印的主动攻击。实验结果表明,该算法无需大量改写载体文本即可有效地破坏零水印。 展开更多
关键词 文本水印 零水印 主动攻击 同义词替换 自然语言处理
下载PDF
基于数据增强的藏汉神经机器翻译研究 被引量:3
19
作者 杨丹 孙义栋 拥措 《计算机与数字工程》 2022年第11期2473-2477,共5页
藏汉机器翻译有利于加强民族团结,有利于推进藏文信息化技术发展与突破不同语言之间的语言壁垒。藏汉神经机器翻译已经在很多翻译任务上获得了显著的提升效果,但它需要大规模的平行语料库作为支撑,而平行语料一直以来都面临着低资源语... 藏汉机器翻译有利于加强民族团结,有利于推进藏文信息化技术发展与突破不同语言之间的语言壁垒。藏汉神经机器翻译已经在很多翻译任务上获得了显著的提升效果,但它需要大规模的平行语料库作为支撑,而平行语料一直以来都面临着低资源语种匮乏的困境。论文希望通过同义词替换和回译两种数据增强策略的研究,为低资源条件下的藏汉机器翻译提供一个研究思路,从而促进藏区社会的发展。通过测试,藏汉机器翻译平均提升了4.59个BLEU值。 展开更多
关键词 藏汉神经机器翻译 数据增强 同义词替换 回译
下载PDF
基于案例推理和粗糙集的商用飞机故障诊断研究 被引量:1
20
作者 晏震乾 曹磊 陈金 《计算机测量与控制》 2020年第8期23-26,31,共5页
为了实现国产商用飞机维修和自动化故障诊断的需要,将商用飞机在役维修积累的维修故障描述记录文档进行信息化和智能化故障诊断;采用基于案例推理和粗糙集结合的方法进行国产商用飞机故障诊断的研究;其中,用MongoDB存储飞机故障案例库,... 为了实现国产商用飞机维修和自动化故障诊断的需要,将商用飞机在役维修积累的维修故障描述记录文档进行信息化和智能化故障诊断;采用基于案例推理和粗糙集结合的方法进行国产商用飞机故障诊断的研究;其中,用MongoDB存储飞机故障案例库,通过构建中文航空词本进行同义词替换减少故障案例描述的中文表述差异,使用粗糙集表示故障案例,粗糙集动态决策计算案例的属性权重并结合海明距离实现案例检索,最后是案例库学习扩充案例库的案例数量和质量,提高基于案例推理国产商用飞机故障诊断系统的可靠性;并通过实验重点验证粗糙集动态决策计算案例的特征属性权重,和结合海明距离相似数计算两个案例间的相似性,证明基于案例推理和粗糙集进行国产商用飞机故障诊断的可行性和有效性。 展开更多
关键词 基于案例推理 粗糙集 海明距离 MONGODB 同义词替换
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部