期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于改进YOLOX的X射线违禁物品检测 被引量:1
1
作者 武连全 楚宪腾 +3 位作者 杨海涛 牛瑾琳 韩虹 王华朋 《红外技术》 CSCD 北大核心 2023年第4期427-435,共9页
在安全检查过程中快速准确地识别违禁物品有利于维护公共安全。针对X射线行李图像中存在的物品堆叠变形、复杂背景干扰、小尺寸违禁物品检测等问题,提出一种改进模型用于违禁物品检测。改进基于YOLOX模型进行,首先在主干网络中引入注意... 在安全检查过程中快速准确地识别违禁物品有利于维护公共安全。针对X射线行李图像中存在的物品堆叠变形、复杂背景干扰、小尺寸违禁物品检测等问题,提出一种改进模型用于违禁物品检测。改进基于YOLOX模型进行,首先在主干网络中引入注意力机制加强神经网络对违禁品的感知能力;其次在Neck部分改进多尺度特征融合方式,在特征金字塔结构后加入Bottom-up结构,增强网络细节表现能力以此提高对小目标的识别率;最后针对损失函数计算的弊端改进IOU损失的计算方式,并根据违禁物品检测任务特点改进各类损失函数的权重,增大对网络误判的惩罚来优化模型。使用该改进模型在SIXray数据集上进行实验,m AP达到89.72%,FPS到达111.7 frame/s具备快速性和有效性,所提模型与阶段主流模型相比准确率和检测速度都有所提升。 展开更多
关键词 YOLOX X射线图像 违禁品 注意力机制
下载PDF
一种无人机视角下的小目标检测算法 被引量:2
2
作者 李杨 武连全 +4 位作者 杨海涛 牛瑾琳 楚宪腾 王华朋 邹清龙 《红外技术》 CSCD 北大核心 2023年第9期925-931,共7页
使用无人机对场景区域中的人、车、物、事等小目标进行实时有效监测有利于维护公共安全。针对无人机视角下小目标存在的目标遮挡、重叠、复杂环境干扰等问题,提出一种无人机视角下的小目标检测算法,该算法使用You Only Look Once X(YOL... 使用无人机对场景区域中的人、车、物、事等小目标进行实时有效监测有利于维护公共安全。针对无人机视角下小目标存在的目标遮挡、重叠、复杂环境干扰等问题,提出一种无人机视角下的小目标检测算法,该算法使用You Only Look Once X(YOLOX)网络作为基线系统,首先在Neck网络部分增大输出特征图减小感受野提高网络的细节表现能力,删除小尺寸特征图的检测头提高小目标的检出率;其次使用Anchor Free的关联机制,降低真值标签中噪声的影响并同时减少参数设置加快网络运行;最后提出一种小目标真实占比系数来计算小目标的位置损失,该系数增大对小目标误判的惩罚使网络对小目标更加敏感。使用该算法在VisDrone2021数据集上进行实验,mAP值较基线系统提高了4.56%,参数量减少29.4%,运算量减少32.5%,检测速度提升19.7%,较其他主流算法也具有优势。 展开更多
关键词 YOLOX VisDrone2021 小目标 无人机航拍
下载PDF
基于深度卷积神经网络的伪造语音检测 被引量:2
3
作者 杨海涛 王华朋 +2 位作者 楚宪腾 牛瑾琳 张琨瑶 《警察技术》 2022年第1期33-36,共4页
为快速准确的识别公安工作中常见的伪造语音,采用深度卷积神经网络(Convolutional Neural Network,CNN)进行伪造语音检测。模型中卷积层可以有效获取声学信息,池化层进行下采样处理防止网络过拟合,全连接层则进行真伪分类。提取英文及... 为快速准确的识别公安工作中常见的伪造语音,采用深度卷积神经网络(Convolutional Neural Network,CNN)进行伪造语音检测。模型中卷积层可以有效获取声学信息,池化层进行下采样处理防止网络过拟合,全连接层则进行真伪分类。提取英文及中文数据库中音频文件的梅尔倒谱系数(Mel-Frequency Cepstral,MFCC)、线性频率倒谱系数(Linear Frequency Cepstral,LFCC)、伽玛通频率倒谱系数(Gammatone Frequency Ceptral Coefficient,GFCC)3种语音声学特征用于模型训练及测试。结果表明MFCC特征在该网络模型上结果最优,且在实验中所提神经网络对99%的伪造语音能够正确区分,在伪造语音检测中表现优秀。 展开更多
关键词 电信网络诈骗 卷积神经网络 伪造语音检测 声学特征
下载PDF
融合LSTM-GRU网络的语音逻辑访问攻击检测
4
作者 杨海涛 王华朋 +2 位作者 牛瑾琳 楚宪腾 林暖辉 《数据采集与处理》 CSCD 北大核心 2022年第2期396-404,共9页
为进一步提高语音欺骗检测的准确率,提出一种融合LSTM-GRU网络的语音逻辑访问攻击(语音转换、语音合成)检测方法。融合LSTM-GRU网络是由长短期记忆网络(Long short-term memory,LSTM)层、门控循环神经单元(Gated recurrent unit,GRU)层... 为进一步提高语音欺骗检测的准确率,提出一种融合LSTM-GRU网络的语音逻辑访问攻击(语音转换、语音合成)检测方法。融合LSTM-GRU网络是由长短期记忆网络(Long short-term memory,LSTM)层、门控循环神经单元(Gated recurrent unit,GRU)层、丢弃层、批归一化层和全连接层串联结合的一种混合网络,其中LSTM层可以解决语音序列中的长时依赖问题,GRU层则可降低模型参数量。实验在ASVspoof2019 LA数据集上进行,提取20维的梅尔倒谱系数特征用于模型训练,在测试阶段使用训练好的LSTM-GRU模型对测试集中的语音进行欺骗检测。与GRU网络及LSTM网络的比较结果表明:LSTM-GRU网络在3种网络模型中正确识别率最高,等错误率(Equal error rate,EER)比ASVspoof2019挑战赛所提供基线系统低27.07%,对逻辑访问攻击语音检测的平均准确率达到98.04%,并且融合LSTM-GRU网络具备训练时间短、防止过拟合及稳定性高等优点。结果证明本文方法可有效应用于语音逻辑访问攻击检测任务中。 展开更多
关键词 逻辑访问攻击 梅尔倒谱系数 等错误率 LSTM-GRU网络
下载PDF
基于卷积循环神经网络的语音逻辑攻击检测
5
作者 杨海涛 王华朋 +3 位作者 楚宪腾 牛瑾琳 林暖辉 张琨瑶 《科学技术与工程》 北大核心 2022年第18期7937-7944,共8页
语音合成和语音转换等技术正逐渐成为合成语音的主流方法,合成语音对社会稳定和国家安全都具有潜在的风险。为进一步提高合成、转换伪造语音检测的准确率,从混合网络模型,特征选择出发,提出了基于CNN-RNN-DNN网络的3种混合网络模型,分别... 语音合成和语音转换等技术正逐渐成为合成语音的主流方法,合成语音对社会稳定和国家安全都具有潜在的风险。为进一步提高合成、转换伪造语音检测的准确率,从混合网络模型,特征选择出发,提出了基于CNN-RNN-DNN网络的3种混合网络模型,分别为CNN-LSTM-DNN、CNN-GRU-DNN、CNN-BiLSTM-DNN。模型中卷积神经网络(convolutional neural network,CNN)部分可以进行下采样,循环神经网络(recurrent neural network,RNN)部分解决语音中的时序问题,深度神经网络(deep neural network,DNN)部分则实现分类功能。每种混合网络模型包含20层网络层。对提取的6种声学特征进行实验,其中CNN-LSTM-DNN+MFCC的组合表现最优,等错误率为5.79%,比ASVspoof2019提供的B02基线系统低28.43%。比较了3种混合网络结合6种特征的表现并增加了其与4种单独网络的对照实验,结果表明本文提出的混合网络模型具有性能稳定、准确率高等优点且梅尔频率倒谱系数(mel-frequency cepstral coefficients,MFCCs)特征及混合梅尔倒谱系数线性频率倒谱系数(linear frequency cepstral coefficient,LFCC)特征更适合此模型。 展开更多
关键词 CNN-RNN-DNN 混合网络模型 混合声学特征 等错误率 ASVspoof2019
下载PDF
基于迁移学习的AI合成人脸图像鉴别研究 被引量:1
6
作者 牛瑾琳 王华朋 +2 位作者 张琨瑶 倪令格 刘元周 《中国司法鉴定》 2021年第4期72-76,共5页
目的人工智能(Artificial Intelligence,AI)生成高质量人脸图像的伪造技术愈发成熟,使得人脸图像的真实性检验面临重大考验。利用一种深度学习的方法对真伪人脸图像进行二分类,以实现对伪造图像的识别。方法提出一种基于迁移学习的方法... 目的人工智能(Artificial Intelligence,AI)生成高质量人脸图像的伪造技术愈发成熟,使得人脸图像的真实性检验面临重大考验。利用一种深度学习的方法对真伪人脸图像进行二分类,以实现对伪造图像的识别。方法提出一种基于迁移学习的方法,构建MobileNetV2网络,保留其在ImageNet数据集上的预训练权值,并对采用FaceSwap技术生成的5274张假脸图像和6650张真脸图像进行辨识。结果迁移模型在测试集上预测的准确度能达到0.94,该网络架构对于真假人脸图像的辨别具有一定的稳健性。结论利用迁移学习的方法能够实现对真伪人脸图像的辨识,在一定程度上对AI合成人脸图像的真实性检验具有借鉴意义。 展开更多
关键词 MobileNetV2网络 FaceSwap技术 AI合成人脸图像辨别
下载PDF
基于深度卷积神经网络的语音降噪研究 被引量:2
7
作者 张琨瑶 王华朋 +2 位作者 牛瑾琳 倪令格 刘元周 《刑事技术》 2021年第5期457-463,共7页
目的为了提高实际工作中获取到的音频资料中语音的质量,降低噪声对语音质量及可懂度的影响,提出了一种基于深度卷积神经网络的语音降噪模型。方法该模型通过卷积、加偏置、批量归一化、Relu激活的多层循环结构,能够有效地对低信噪比条... 目的为了提高实际工作中获取到的音频资料中语音的质量,降低噪声对语音质量及可懂度的影响,提出了一种基于深度卷积神经网络的语音降噪模型。方法该模型通过卷积、加偏置、批量归一化、Relu激活的多层循环结构,能够有效地对低信噪比条件下语音中的洗衣机噪声、鼓掌噪声、汽车内部噪声等多种常见的环境噪声进行降噪处理。结果最终含噪语音经过模型处理后的MOS评分达到3.91分,其中最高分4.05分,最低分3.81分。结论该模型能够切实提高含噪语音的质量及可懂度,对于实际的公安工作、智慧警务建设、语音分析、语音文本识别等具有重要的意义和价值。 展开更多
关键词 深度卷积神经网络 语音降噪 环境噪声
下载PDF
翻录对语音真实性检验的影响研究 被引量:2
8
作者 倪令格 王华朋 +2 位作者 刘元周 张琨瑶 牛瑾琳 《中国人民公安大学学报(自然科学版)》 2020年第4期8-14,共7页
目的深入研究在法庭语音证据的真实性检验中,翻录操作对常用声痕迹特征产生的影响。方法录制100段原始语音,其中20段语音经实验室、室外环境直接转录,80段语音进行篡改处理后利用不同采样设备转录,得到翻录后语音。然后使用声纹鉴定工... 目的深入研究在法庭语音证据的真实性检验中,翻录操作对常用声痕迹特征产生的影响。方法录制100段原始语音,其中20段语音经实验室、室外环境直接转录,80段语音进行篡改处理后利用不同采样设备转录,得到翻录后语音。然后使用声纹鉴定工作站及Adobe Audition软件对翻录前后的数字音频,分别在文件属性、听觉和图谱检验等方面进行比对和分析。结果翻录过程会留下操作本身产生的声痕迹特征,在声谱图上表现为语音的本底噪声增强、频响范围改变、动作声痕迹遗留;翻录时高采样率设备平滑篡改痕迹的效果优于低采样率设备。结论总结出翻录对文件属性、听觉分析,篡改点图谱等造成的影响及翻录后篡改痕迹的变化规律,实验结果对司法语音真实性检验具有重要借鉴价值。 展开更多
关键词 翻录 法庭语音 真实性 声谱图
下载PDF
夜间涉案图像的去雾技术
9
作者 张志豪 孙鹏 +1 位作者 王泽励 牛瑾琳 《警察技术》 2021年第1期52-55,共4页
夜间雾天条件下摄像设备获得的图像常出现颜色失真、光晕伪影等问题,这会导致图像信息丢失,不利于对图像内容信息的提取,给视频侦查工作带来困扰。为解决上述问题,提出一种基于像素级Alpha混合方法。首先依据大气散射模型,对图像中光源... 夜间雾天条件下摄像设备获得的图像常出现颜色失真、光晕伪影等问题,这会导致图像信息丢失,不利于对图像内容信息的提取,给视频侦查工作带来困扰。为解决上述问题,提出一种基于像素级Alpha混合方法。首先依据大气散射模型,对图像中光源区和非光源区分别依据亮通道先验和暗通道先验估算相应的透射率,然后基于亮度感知权重图有效地把二者融合为一个混合透射率。接着,基于Retinex理论,使用一种通道差分引导滤波方法来估计环境照度。最后,在处理实际涉案图像的实验中表明,该方法能在颜色一致性和减少去雾图像中的光晕伪影方面取得很好的效果,能为公安侦查工作提供直观的图像信息。 展开更多
关键词 涉案图像 Alpha混合 夜间图像去雾 通道差分引导滤波
下载PDF
不同语音特征对声音分类的有效性研究 被引量:3
10
作者 王华朋 牛瑾琳 +1 位作者 刘元周 张琨瑶 《中国刑警学院学报》 2020年第6期122-128,共7页
声音信号分类是准确进行语音预测、解码和识别的基础工作。深度神经网络是目前音频分类的主流方法。选用19种不同语音特征,以3种噪声作为分类对象,采用深度长短时记忆神经网络作为分类算法,比较了不同语音特征及特征融合对噪声信号分类... 声音信号分类是准确进行语音预测、解码和识别的基础工作。深度神经网络是目前音频分类的主流方法。选用19种不同语音特征,以3种噪声作为分类对象,采用深度长短时记忆神经网络作为分类算法,比较了不同语音特征及特征融合对噪声信号分类准确度的影响,总结了不同特征对信号分类的有效程度,并对实验结果进行了说话人识别验证。该研究对公安领域说话人身份识别具有一定的参考价值。 展开更多
关键词 信号分类 语音特征 深度神经网络 LSTM
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部