期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于Arnold-DWT-QR的脆弱性图像水印算法 被引量:2
1
作者 黄喜阳 杜庆治 +3 位作者 马迪南 龙华 邵玉斌 刘尧 《陕西理工大学学报(自然科学版)》 2024年第1期65-72,共8页
在人物新闻图像中,人眼视觉更关注于人脸高频细节部分,为实现含水印的人物新闻图像受到任何微弱攻击情况下均不能完整提取出水印信息,且具有较好的不可感知性,提出了一种Arnold置乱结合离散小波变换(DWT)、正交三角分解法(QR)的脆弱性... 在人物新闻图像中,人眼视觉更关注于人脸高频细节部分,为实现含水印的人物新闻图像受到任何微弱攻击情况下均不能完整提取出水印信息,且具有较好的不可感知性,提出了一种Arnold置乱结合离散小波变换(DWT)、正交三角分解法(QR)的脆弱性图像水印算法。首先将水印图像进行Arnold置乱加密,再提取载体图像B通道中人眼不敏感的低频细节部分进行QR分解,最后将Arnold置乱加密后的水印图像QR分解后嵌入在载体图像矩阵R中每一个元素,使较少的水印信息均嵌入在载体图像的每一个像素中。实验结果表明,该算法在未受攻击情况下平均峰值信噪比(PSNR)为51 dB,归一化相关系数(NC)为1.0,在任何强度的攻击下均无法提取完整水印图像,具有较好的人物新闻图像认证能力。 展开更多
关键词 脆弱性图像水印 ARNOLD置乱 离散小波变换 QR分解 图像认证
下载PDF
基于变分信息瓶颈多任务算法的多领域文本分类
2
作者 马儀 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期125-135,共11页
多领域文本分类存在领域差异和词汇差异,导致分类的准确性和泛化性低,传统方法无法取得很好的效果.针对上述问题,本文提出基于变分信息瓶颈多任务算法的多领域文本分类方法,将任务建模为从综合特征中提取任务专属特征的分层学习表示问题... 多领域文本分类存在领域差异和词汇差异,导致分类的准确性和泛化性低,传统方法无法取得很好的效果.针对上述问题,本文提出基于变分信息瓶颈多任务算法的多领域文本分类方法,将任务建模为从综合特征中提取任务专属特征的分层学习表示问题.首先基于信息瓶颈原理,将综合特征和任务专属特征之间存在的冗余信息建模为均值为零,方差为对角矩阵的加性噪声,通过重参数化方法让噪声参与模型训练;其次通过信息瓶颈的变分边界构建模型损失函数以限制模型的信息流动,从而将带有加性噪声的综合特征解耦为任务专属特征;最后通过解码器中的分类器处理任务专属特征得到文本分类结果.实验表明,该模型在FDU-MTL多领域文本分类数据集上的平均分类准确率达到92.17%,较多个对比模型有明显提升,且该模型具有更好的可解释性. 展开更多
关键词 信息瓶颈 多任务模型 多领域 变分边界 可解释性
下载PDF
用于实体对齐的多跳邻域联合采样方法
3
作者 祁雨婷 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期144-152,共9页
实体对齐的目的是寻找不同知识图谱中指向同一概念的实体,然而不同知识图谱之间的结构异构性增加了实体对齐的难度.现有方法主要使用实体邻域信息来降低结构异构性,但仍未对邻域的构建进行优化.因此,提出一种用于实体对齐的多跳邻域联... 实体对齐的目的是寻找不同知识图谱中指向同一概念的实体,然而不同知识图谱之间的结构异构性增加了实体对齐的难度.现有方法主要使用实体邻域信息来降低结构异构性,但仍未对邻域的构建进行优化.因此,提出一种用于实体对齐的多跳邻域联合采样方法.首先使用图卷积神经网络得到两个知识图谱中实体的嵌入向量;其次使用多跳邻域联合采样机制,基于邻居实体在本实体多跳子邻域中的复现频次,计算出邻居实体的结构采样权重,基于邻居实体与本实体间的语义相似度,计算出邻居实体的语义采样权重,联合结构采样权重和语义采样权重,遍历所有实体,为每个实体采样多跳邻居,构建出各自的多跳邻域;之后将这些实体及其候选实体间的多跳邻域跨图交互信息聚合于实体嵌入向量中,最后计算嵌入向量间的对齐距离.在实体对齐公共数据集DBP15k的3个跨语言子集上进行实验,相较于基线模型,所提方法在Hit@1指标上分别提升3.3%,3.5%和1.8%.实验结果表明所提方法能有效提升实体对齐结果的准确性. 展开更多
关键词 知识图谱 实体对齐 多跳邻域 邻域结构 语义相关性
下载PDF
基于胶囊网络的恶意评论检测
4
作者 李公瑾 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期452-459,共8页
针对传统恶意评论检测模型无法适应不断更新的网络文化和语言习惯以及神经网络丢失信息的问题,提出了一种基于胶囊网络的检测模型.首先,采用BERT模型提取词向量的特征,以保留文本的潜在语义信息;然后,通过胶囊网络在局部范围内提取特征... 针对传统恶意评论检测模型无法适应不断更新的网络文化和语言习惯以及神经网络丢失信息的问题,提出了一种基于胶囊网络的检测模型.首先,采用BERT模型提取词向量的特征,以保留文本的潜在语义信息;然后,通过胶囊网络在局部范围内提取特征表示,并结合Bi-LSTM在全局范围内提取特征表示,以获得更全面的特征表示;其次,利用注意力机制将局部和全局的特征表示进行融合,提取关键信息并降低特征表示的维度;最后,使用Sigmoid分类器对结果进行分类,并输出检测结果.实验结果表明,所提出的组合模型相对于传统模型能够提取到更精细的语义信息,有效地提高了分类效果,在恶意评论的检测任务中,准确度达到了0.922. 展开更多
关键词 恶意评论检测 胶囊网络 局部特征 全局特征
下载PDF
基于联合情感的多任务谣言检测方法
5
作者 马儀 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期642-653,共12页
情感分析在社交媒体谣言检测中有重要作用,现有的谣言检测方法侧重于使用文章的情感特征,忽略了用户评论与文章的联合情感,单任务深度学习谣言检测方法缺少足够的标签数据导致准确率难以提升.为解决上述问题,基于谣言检测与联合情感检... 情感分析在社交媒体谣言检测中有重要作用,现有的谣言检测方法侧重于使用文章的情感特征,忽略了用户评论与文章的联合情感,单任务深度学习谣言检测方法缺少足够的标签数据导致准确率难以提升.为解决上述问题,基于谣言检测与联合情感检测两个任务的相关性,提出了多任务联合学习的谣言检测方法,在同一模型中实现联合情感检测以及谣言检测两个任务.首先,构建编码器提取文章及对应评论的语义特征并映射到同一语义空间,并通过注意力机制加权融合语义特征;其次,通过基于公共情感分类器与情感词典共同构建的情感提取网络提取文章与对应评论的情感特征;最后,将语义特征与联合情感特征融合后输入到两个共享损失函数的分类器中,分别得到谣言检测和联合情感检测的分类结果.实验结果表明,多任务模型的效果强于单任务模型,在公开的中文Weibo-16数据集、英文Twitter-15数据集上相较于对比方法中最好的方法,提出的模型在准确率上分别提升了3.5和2.9个百分点,F1值提高了3.1和3.9个百分点. 展开更多
关键词 谣言检测 用户评论 联合情感 多任务学习
下载PDF
基于多种分词情况的中文命名实体识别
6
作者 田地 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期350-356,共7页
针对中文词语边界不明确,词语和句子上下文关系被忽略的问题,设计一种基于多种分词情况的歧义分词信息抑制算法.在预处理中根据预训练的词汇频率表计算语句中不同分词的权重,将最有可能的分词情况与其他分词情况进行区分,合并至语句中,... 针对中文词语边界不明确,词语和句子上下文关系被忽略的问题,设计一种基于多种分词情况的歧义分词信息抑制算法.在预处理中根据预训练的词汇频率表计算语句中不同分词的权重,将最有可能的分词情况与其他分词情况进行区分,合并至语句中,在自注意力机制提取语句上下文信息时加入分词权重信息,添加正确分词有效的边界信息,抑制歧义分词错误的前后文关系.对比MarkBert与W2NER算法,在公开数据集Resume、 MSRA、 Weibo、 OntoNotes中的试验结果表明,歧义分词信息抑制算法的预测准确率、句子长度增加时的鲁棒性、数据集增大时的预测准确率均有更好的表现. 展开更多
关键词 命名实体识别 预训练模型 自注意力 词边界信息
下载PDF
基于主成分的频谱迭代稀疏化语音增强方法
7
作者 董娴 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期229-237,共9页
针对现有频谱稀疏化方法在复杂环境语音增强上性能不佳的问题,提出一种基于主成分分析的迭代频谱稀疏化方法.首先,对输入信号的语谱图进行二维中值滤波处理,得到行分量频谱和列分量频谱;对包含语音主音的行分量频谱序列进行主成分分析(P... 针对现有频谱稀疏化方法在复杂环境语音增强上性能不佳的问题,提出一种基于主成分分析的迭代频谱稀疏化方法.首先,对输入信号的语谱图进行二维中值滤波处理,得到行分量频谱和列分量频谱;对包含语音主音的行分量频谱序列进行主成分分析(PCA),以去除噪声部分并保留主要语音结构;然后联合列分量频谱序列和缩放因子进行混合重构原信号,并采用动态缩放因子实现对列分量频谱噪声的有效控制.在此基础上,利用稀疏化对噪声的抑制作用,对频谱进行多次稀疏化,以减弱噪声.实验结果表明,该方法增强了不同类型噪声下语音的信噪比,包括White、Pink、Babble、Volvo和Factory等五种噪声,输入信噪比为15 dB,所提方法的信噪比分别提升了13.89 dB,11.97 dB,5.65 dB,5.26 dB和4.73 dB,该方法在其他信噪比下也能有效地抑制噪声和保留有效特征信息,并减少因背景噪声引起的语音失真. 展开更多
关键词 语音增强 多维度频谱分析 谱稀疏化 主成分分析
下载PDF
基于新闻文本图像的鲁棒水印算法
8
作者 刘尧 杜庆治 +3 位作者 马迪南 龙华 邵玉斌 黄喜阳 《现代电子技术》 北大核心 2024年第3期43-50,共8页
在新闻文本图像中,现有的水印算法没有将表达文本部分的区域与其他背景区域进行区分,并且对二值水印图像嵌入时只在单通道嵌入导致鲁棒性不高。针对以上问题,提出基于新闻文本图像的鲁棒水印算法。首先将新闻文本图像进行大津阈值分割(O... 在新闻文本图像中,现有的水印算法没有将表达文本部分的区域与其他背景区域进行区分,并且对二值水印图像嵌入时只在单通道嵌入导致鲁棒性不高。针对以上问题,提出基于新闻文本图像的鲁棒水印算法。首先将新闻文本图像进行大津阈值分割(OSTU),将文本与背景区域区分开,选择文本区域进行嵌入加深对重要信息的版权保护;接着将文本图像Cr和Cb通道的文本区域进行离散小波变换(DWT)后,利用主成分分析(PCA)进行能量集中并计算各主成分贡献率,通过比较贡献率来选择嵌入的主成分;最后对主成分及水印图像进行奇异值分解(SVD)完成水印嵌入。经过实验表明,嵌入水印图像在面对滤波等大多数常规攻击的NC值都在0.99以上,表明该算法有较强的鲁棒性,同时该算法在嵌入水印后图像的PSNR均值为45.66 dB,保证了不可感知性。 展开更多
关键词 图像水印 大津阈值分割 主成分分析 小波变换 奇异值分解 NC值
下载PDF
基于双向胶囊网络的恶意评论检测
9
作者 李公瑾 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《计算机工程与科学》 CSCD 北大核心 2024年第10期1765-1774,共10页
为了解决现有检测模型无法准确识别语言风格多变、语意隐晦的恶意评论问题,提出了一种基于双向胶囊网络的恶意评论检测模型。首先,利用BERT模型对评论文本进行词嵌入,创建输入矩阵;其次,将输入矩阵传递给双向特征提取层,该层由堆叠的LST... 为了解决现有检测模型无法准确识别语言风格多变、语意隐晦的恶意评论问题,提出了一种基于双向胶囊网络的恶意评论检测模型。首先,利用BERT模型对评论文本进行词嵌入,创建输入矩阵;其次,将输入矩阵传递给双向特征提取层,该层由堆叠的LSTM、双向胶囊网络和注意力网络组成,从正向和反向同时捕获文本的深层语义信息,将生成的正向和反向矩阵拼接起来并输入到注意力机制中,聚焦与恶意评论相关的词语并生成输出向量;再次,拼接输出向量与语境辅助特征向量,丰富特征表示;最后,将拼接向量输入到全连接层中,通过Sigmoid激活函数对评论文本进行分类。在维基百科恶意评论数据集上进行的实验表明,相较于现有研究,基于双向胶囊网络的恶意评论检测模型性能提升显著,能够捕获评论文本中更丰富的语义信息,有效检测恶意评论。 展开更多
关键词 BERT语言模型 双向胶囊网络 语境辅助特征 恶意评论检测
下载PDF
结合混合特征提取与深度学习的长文本语义相似度计算
10
作者 徐捷 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《计算机工程与科学》 CSCD 北大核心 2024年第8期1513-1520,共8页
文本语义相似度计算是自然语言处理中一项非常重要的任务,但是目前对于文本语义相似度的研究多集中在短文本领域,而不是长文本。相较于短文本,长文本语义信息丰富,但同时语义信息容易分散。针对长文本语义信息分散的问题,提出一种特征... 文本语义相似度计算是自然语言处理中一项非常重要的任务,但是目前对于文本语义相似度的研究多集中在短文本领域,而不是长文本。相较于短文本,长文本语义信息丰富,但同时语义信息容易分散。针对长文本语义信息分散的问题,提出一种特征提取模型,提取出长文本的主要语义信息;对提取的语义信息使用滑窗重叠的方法输入BERT预训练模型得到文本向量表示;然后,通过双向长短期记忆网络建模长文本的前后语义联系,将其映射到语义空间内;再通过线性层增加模型表示能力;最后,通过相似语义向量内积最大化和交叉熵损失函数进行微调。实验结果表明,该模型在CNSE和CNSS数据集上F1分数分别为0.84和0.91,性能优于基线模型。 展开更多
关键词 长文本语义相似度 特征提取 BERT预训练模型 语义空间
下载PDF
谐波结构相位估计联合幅度补偿的语音增强方法
11
作者 董娴 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第5期935-944,共10页
传统语音增强方法,通常只对含噪语音信号的幅度进行增强处理,忽略了相位信息。相位谱在语音的可懂度和感知质量方面也具有积极影响。为了解决传统语音增强方法对相位处理的不足以及在语音增强过程中普遍存在的可理解性较低的问题,提出... 传统语音增强方法,通常只对含噪语音信号的幅度进行增强处理,忽略了相位信息。相位谱在语音的可懂度和感知质量方面也具有积极影响。为了解决传统语音增强方法对相位处理的不足以及在语音增强过程中普遍存在的可理解性较低的问题,提出一种谐波结构相位估计联合幅度补偿的语音增强方法,该方法强调谐波结构的相位估计恢复浊音信息,并针对由浊音相位估计后清音特征被背景噪声破坏引起的语音信息丢失问题,提出一种平滑背景噪声策略来抑制噪声的影响。此外,还利用谐波比分离谐波结构和清音特征,基于谐波判决来判断是否应该平滑背景噪声,为避免不可靠的判决导致清音特征损失,在谐波判决的基础上还增加了清音特征信息的利用。实验结果表明,该方法在白噪声环境下的信噪比(signal to noise ratio,SNR)、语音质量感知评估(perceptual evaluation of speech quality,PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)分别提升了12.02 dB,1.03和0.07,进一步证实该方法可以有效减少语音失真,提高噪声环境下语音信号质量和可懂度。 展开更多
关键词 相位估计 语音增强 谐波结构 幅度补偿
下载PDF
基于SURF的小波域自适应水印算法 被引量:2
12
作者 李帅 龙华 +3 位作者 杜庆治 马迪南 周筝 梁昌侯 《现代电子技术》 2023年第17期70-76,共7页
数字水印技术作为信息隐藏的分支领域,是进行数字版权保护的有效手段。针对水印嵌入强度的不确定性问题,同时为增强水印抵抗旋转攻击的能力,提出一种基于加速鲁棒特征(SURF)的小波域自适应水印算法。首先,对原始载体图像进行两级离散小... 数字水印技术作为信息隐藏的分支领域,是进行数字版权保护的有效手段。针对水印嵌入强度的不确定性问题,同时为增强水印抵抗旋转攻击的能力,提出一种基于加速鲁棒特征(SURF)的小波域自适应水印算法。首先,对原始载体图像进行两级离散小波变换(DWT),提取低频子带进行奇异值分解(SVD);然后对水印图像进行奇异值分解,利用加性嵌入规则将水印图像的奇异值矩阵叠加到原始载体图像的奇异值矩阵中,再经过逆变换即可得到含水印载体图像;利用加速鲁棒特征算法对经过旋转攻击的含水印载体图像进行旋转校正。对于嵌入强度不确定性,构建适应度函数,利用麻雀搜索算法(SSA)对其寻优进而达到水印嵌入强度自适应的目的。实验结果表明,含水印的载体图像有良好的不可感知性,峰值信噪比(PSNR)在40 dB以上。所提算法对于常见的水印攻击具有较强的鲁棒性,归一化相关系数(NC)大多都在0.98以上。 展开更多
关键词 数字水印 小波变换 加速鲁棒特征 麻雀搜索算法 离散小波变换 奇异值分解
下载PDF
基于子图结构语义增强的少样本知识图谱补全
13
作者 杨荣泰 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《北京邮电大学学报》 EI CAS CSCD 北大核心 2024年第4期71-76,89,共7页
针对少样本场景下实体表示不充分的问题,提出一种基于子图结构语义增强的少样本知识图谱补全模型。首先,采用注意力机制,提取节点以关系交互为核心的文本语义特征,并提取节点以集群系数为核心的子图结构语义特征;接着,使用前馈神经网络... 针对少样本场景下实体表示不充分的问题,提出一种基于子图结构语义增强的少样本知识图谱补全模型。首先,采用注意力机制,提取节点以关系交互为核心的文本语义特征,并提取节点以集群系数为核心的子图结构语义特征;接着,使用前馈神经网络实现实体语义聚合,并利用Transformer网络针对三元组进行编码;最后,通过原型匹配网络来计算链接预测分数。实验表明,所提模型优于所有基于度量学习的基线模型,对比最新基于元学习的基线模型,在NELL-One数据集上Hits@1指标得到改善,Wiki-One数据集上所有指标得到提升,表明所提模型在增强实体表示和提升实体链接的预测效果上是有效的。 展开更多
关键词 少样本学习场景 知识图谱补全 集群系数 结构语义 注意力机制
原文传递
云南日报数字化工程项目设计与实现
14
作者 沙德钟 马迪南 《中国报业》 2012年第12X期24-26,共3页
设计和实施整体化数字系统,对云南日报自1950年创刊号到2008年末的历史报纸纸样进行数字化处理,实现云南日报电子化发行,实现网络访问和资料检索。
关键词 云南日报 历史报纸 数字化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部