期刊文献+
共找到48篇文章
< 1 2 3 >
每页显示 20 50 100
基于改进ECAPA-TDNN的法庭自动说话人识别
1
作者 万玫汐 王华朋 +2 位作者 闫道申 刘鹏展 许铭洋 《科学技术与工程》 北大核心 2024年第27期11763-11773,共11页
为提高法庭说话人识别的可靠性和准确性,促进法庭语音检验方法和过程的科学评价范式转化,提出了一种基于改进通道注意力机制融合时延神经网络(emphasized channel attention propagation aggregation time delay neural network,ECAPA-T... 为提高法庭说话人识别的可靠性和准确性,促进法庭语音检验方法和过程的科学评价范式转化,提出了一种基于改进通道注意力机制融合时延神经网络(emphasized channel attention propagation aggregation time delay neural network,ECAPA-TDNN)模型的法庭自动说话人识别方法。该方法为提高模型的准确率和泛化能力,融合空间注意力机制、通道注意力机制和多头注意力机制。首先,选择训练效果最佳的频谱图与伽马频率倒谱系数(gammatone frequency cepstral coefficients,GFCC)融合特征输入网络模型,把训练完成的神经网络作为深度特征提取器,然后,在法庭证据似然比量化评估体系中评估语音证据的强度。实验结果表明:在VoxCeleb1数据集上,Cllr值为0.156,优于之前发表文献中的法庭自动说话人识别系统结果;在中文zhaishell数据集上,误判率和漏判率均为零,并且支持同源假设的似然比最小值为1.72×10^(6),支持非同源假设的似然比最大值为5.83×10^(-21)。该方法进一步提高了识别系统的可靠性和准确性,可以为法庭语音证据评估结论提供强有力的支撑。 展开更多
关键词 说话人识别 似然比 ECAPA-TDNN 注意力机制 特征融合
下载PDF
基于改进YOLOX的X射线违禁物品检测 被引量:4
2
作者 武连全 楚宪腾 +3 位作者 杨海涛 牛瑾琳 韩虹 王华朋 《红外技术》 CSCD 北大核心 2023年第4期427-435,共9页
在安全检查过程中快速准确地识别违禁物品有利于维护公共安全。针对X射线行李图像中存在的物品堆叠变形、复杂背景干扰、小尺寸违禁物品检测等问题,提出一种改进模型用于违禁物品检测。改进基于YOLOX模型进行,首先在主干网络中引入注意... 在安全检查过程中快速准确地识别违禁物品有利于维护公共安全。针对X射线行李图像中存在的物品堆叠变形、复杂背景干扰、小尺寸违禁物品检测等问题,提出一种改进模型用于违禁物品检测。改进基于YOLOX模型进行,首先在主干网络中引入注意力机制加强神经网络对违禁品的感知能力;其次在Neck部分改进多尺度特征融合方式,在特征金字塔结构后加入Bottom-up结构,增强网络细节表现能力以此提高对小目标的识别率;最后针对损失函数计算的弊端改进IOU损失的计算方式,并根据违禁物品检测任务特点改进各类损失函数的权重,增大对网络误判的惩罚来优化模型。使用该改进模型在SIXray数据集上进行实验,m AP达到89.72%,FPS到达111.7 frame/s具备快速性和有效性,所提模型与阶段主流模型相比准确率和检测速度都有所提升。 展开更多
关键词 YOLOX X射线图像 违禁品 注意力机制
下载PDF
一种无人机视角下的小目标检测算法 被引量:2
3
作者 李杨 武连全 +4 位作者 杨海涛 牛瑾琳 楚宪腾 王华朋 邹清龙 《红外技术》 CSCD 北大核心 2023年第9期925-931,共7页
使用无人机对场景区域中的人、车、物、事等小目标进行实时有效监测有利于维护公共安全。针对无人机视角下小目标存在的目标遮挡、重叠、复杂环境干扰等问题,提出一种无人机视角下的小目标检测算法,该算法使用You Only Look Once X(YOL... 使用无人机对场景区域中的人、车、物、事等小目标进行实时有效监测有利于维护公共安全。针对无人机视角下小目标存在的目标遮挡、重叠、复杂环境干扰等问题,提出一种无人机视角下的小目标检测算法,该算法使用You Only Look Once X(YOLOX)网络作为基线系统,首先在Neck网络部分增大输出特征图减小感受野提高网络的细节表现能力,删除小尺寸特征图的检测头提高小目标的检出率;其次使用Anchor Free的关联机制,降低真值标签中噪声的影响并同时减少参数设置加快网络运行;最后提出一种小目标真实占比系数来计算小目标的位置损失,该系数增大对小目标误判的惩罚使网络对小目标更加敏感。使用该算法在VisDrone2021数据集上进行实验,mAP值较基线系统提高了4.56%,参数量减少29.4%,运算量减少32.5%,检测速度提升19.7%,较其他主流算法也具有优势。 展开更多
关键词 YOLOX VisDrone2021 小目标 无人机航拍
下载PDF
基于深度嵌入向量的说话人分割研究
4
作者 许铭洋 王华朋 +2 位作者 闫道申 杨海涛 楚宪腾 《刑事技术》 2023年第5期466-472,共7页
为提高多说话人混合语音分割的准确度,本文提出了采用广义端到端损失函数训练说话人深度嵌入向量提取模型用于多说话人分割。该方法首先训练基于长短时记忆的深度神经网络作为深度嵌入向量提取器;其次,在音频文件中截取每个说话人的参... 为提高多说话人混合语音分割的准确度,本文提出了采用广义端到端损失函数训练说话人深度嵌入向量提取模型用于多说话人分割。该方法首先训练基于长短时记忆的深度神经网络作为深度嵌入向量提取器;其次,在音频文件中截取每个说话人的参考语音段并训练其嵌入向量;最后,比较音频文件的连续嵌入与每个说话人嵌入之间的余弦相似度得分,实现说话人分割。该方法采用先识别后分割的原理,在能够预知说话人数量的场景中有较好的分割效果,可以为多说话人自动识别系统自动分割目标说话人语音,提高工作效率。 展开更多
关键词 说话人分割 长短时记忆 广义端到端 音频嵌入 余弦相似度
下载PDF
基于高效注意力机制的说话人识别 被引量:1
5
作者 闫道申 邵冬梅 +2 位作者 许铭洋 楚宪腾 王华朋 《警察技术》 2023年第4期47-51,共5页
注意力机制已被证明能够提升识别任务中的识别准确率。但是,大多数现有注意力机制致力于开发更复杂的模型以实现更好的性能,这不可避免地增加了模型的复杂性。针对这一问题,将高效通道注意力机制与改进的残差网络相结合,使用附加角裕度... 注意力机制已被证明能够提升识别任务中的识别准确率。但是,大多数现有注意力机制致力于开发更复杂的模型以实现更好的性能,这不可避免地增加了模型的复杂性。针对这一问题,将高效通道注意力机制与改进的残差网络相结合,使用附加角裕度损失作为损失函数,提出了一种基于高效通道注意力机制的说话人识别模型。通过消融实验比较跨通道信息交互范围,确定高效通道注意力机制的最佳卷积核。实验结果表明,该模型在中文语料库Zhaishell子集上取得了98.54%的识别准确率。相较于使用交叉熵损失函数的挤压激励残差网络模型和使用附加角裕度损失函数的挤压激励残差网络模型,模型准确率分别提高了3.73%和2.19%,模型的估计参数总量减少。因此,基于高效注意力机制的说话人识别更适用对参数总量有要求的轻量级任务。 展开更多
关键词 说话人识别 高效通道注意力机制 卷积神经网络 残差网络
下载PDF
基于模糊卡尔曼滤波的信息融合算法 被引量:10
6
作者 王华朋 裴承鸣 +1 位作者 钟雄虎 李少伟 《计算机测量与控制》 CSCD 2006年第9期1230-1232,共3页
应用自适应模糊逻辑系统(AFLS)原理,研究了一种基于卡尔曼滤波器的信息融合算法;AFLS通过在线监视融合数据新息是否为零均值白噪音,然后根据模糊规则调整融合滤波器的指数加权值,从而保证了滤波器的最优估计性能;仿真结果证明该方法在... 应用自适应模糊逻辑系统(AFLS)原理,研究了一种基于卡尔曼滤波器的信息融合算法;AFLS通过在线监视融合数据新息是否为零均值白噪音,然后根据模糊规则调整融合滤波器的指数加权值,从而保证了滤波器的最优估计性能;仿真结果证明该方法在高噪声环境中具有良好的信息融合能力,能有效跟踪研究对象的状态变化。 展开更多
关键词 信息融合 模糊加权 自适应模糊逻辑系统 卡尔曼滤波
下载PDF
应用似然比框架的法庭说话人识别 被引量:11
7
作者 王华朋 杨军 许勇 《数据采集与处理》 CSCD 北大核心 2013年第2期239-243,共5页
为了检验元音倒谱特征在法庭说话人识别中的性能,提出了使用元音稳定段美尔倒谱系数(Mel-frequencycepstral coefficients,MFCC)作为识别特征的基于似然比的法庭说话人识别方法,并使用45人电话对话录音中元音/a/作为样本进行了测试。实... 为了检验元音倒谱特征在法庭说话人识别中的性能,提出了使用元音稳定段美尔倒谱系数(Mel-frequencycepstral coefficients,MFCC)作为识别特征的基于似然比的法庭说话人识别方法,并使用45人电话对话录音中元音/a/作为样本进行了测试。实验结果表明,该方法不仅能正确识别说话人,而且能根据当前嫌疑人样本和问题语音样本的差异,量化该语音样本作为证据的力度,为法庭提供科学合理的证据评估结果。与人工提取共振峰特征相比,自动特征提取的引入提高了工作效率,使识别系统的性能获得了大幅提升。 展开更多
关键词 MFCC 似然比 法庭说话人识别 证据力度
下载PDF
一种改进的基于GMM-UBM的法庭自动说话人识别系统 被引量:4
8
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2013年第6期800-805,共6页
对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道... 对基于高斯混合模型(GMM)的法庭自动说话人识别系统进行改进.通过参考人群数据库降低了对嫌疑人语音样本数量的需求.以小规模背景人群数据库建立改进的基于高斯混合模型-通用背景模型(GMM-UBM)的法庭自动说话人识别系统.以固定电话信道和移动手机信道的数据库进行了系统的测试. 展开更多
关键词 似然比 法庭自动说话人识别 高斯混合模型-通用背景模型
下载PDF
改进的非匹配信道法庭自动说话人识别方法 被引量:2
9
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《电声技术》 2013年第4期61-67,71,共8页
在新的似然比法庭证据评估体系下,为降低对问题语音和嫌疑人语音样本数量的要求,提出了改进的基于GMM-UBM识别核心的法庭自动说话人识别系统。为降低信道差异对法庭自动说话人识别系统性能的影响,提出了一种不同信道间说话人模型补偿与L... 在新的似然比法庭证据评估体系下,为降低对问题语音和嫌疑人语音样本数量的要求,提出了改进的基于GMM-UBM识别核心的法庭自动说话人识别系统。为降低信道差异对法庭自动说话人识别系统性能的影响,提出了一种不同信道间说话人模型补偿与Logistic回归混合处理的方法。固定电话信道和移动电话信道的实验结果表明:改进的自动识别系统在非匹配信道中使用4秒的测试语音,与未使用模型补偿的系统相比,错误认定率从28.95%下降为6.32%,大幅度提高了系统在非匹配条件下的可靠性。 展开更多
关键词 非匹配信道 法庭说话人识别 似然比
下载PDF
基于深度双向LSTM网络的说话人识别 被引量:5
10
作者 王华朋 《计算机工程与设计》 北大核心 2020年第6期1768-1772,共5页
为进一步提高说话人识别的准确率,提出一种基于深度双向长短时记忆(long short-term memory,LSTM)网络的说话人识别方法,实现文本无关端到端的说话人身份识别。双向利用语音的序列数据,通过记忆单元,增强上下层之间的联系,提高对语音序... 为进一步提高说话人识别的准确率,提出一种基于深度双向长短时记忆(long short-term memory,LSTM)网络的说话人识别方法,实现文本无关端到端的说话人身份识别。双向利用语音的序列数据,通过记忆单元,增强上下层之间的联系,提高对语音序列数据的分类能力。实验结果表明,在实验室环境下,对5 s时长的短语音,正确识别率达到97.92%,对噪声干扰具有良好的鲁棒性。该方法能学习语音序列信号特征,应用序列变化信息,可有效进行说话人识别。 展开更多
关键词 长短时记忆 端到端 说话人识别 深度学习 循环神经网络
下载PDF
基于微课教育的公安教育模式优化研究 被引量:2
11
作者 王华朋 何芳州 王祉淇 《辽宁警察学院学报》 2019年第4期110-113,共4页
公安教育的信息化发展是当前提升公安教育质量的主要路径,而微课教育模式的兴起也是其中极为重要的教育革新方向。但微课教育仅为教学工具,运用得当才能优化公安教育质量,否则无法真正实现与公安教育需求的有效对接。为此,本文从微课特... 公安教育的信息化发展是当前提升公安教育质量的主要路径,而微课教育模式的兴起也是其中极为重要的教育革新方向。但微课教育仅为教学工具,运用得当才能优化公安教育质量,否则无法真正实现与公安教育需求的有效对接。为此,本文从微课特点角度出发,解析了公安教育借助微课的优势。同时以课前、课中、课后、课堂评价的时间轴为主线路,设计了基于微课教育的公安教育模式优化方案构思,以便为公安教育引入和设计微课教育模式提供理论参考。 展开更多
关键词 微课教育 公安教育 优化模式
下载PDF
现代教育信息化技术在公安成人教育实训课程教学中的应用 被引量:2
12
作者 王华朋 王一博 陈学国 《教育教学论坛》 2018年第51期67-68,共2页
针对公安成人教育实训课程教学现状,将现代教育信息化技术应用于《毒物分析》实训课程教学中,通过优化教学内容、创新授课方式,引入新的教学模式,激发学员学习兴趣,提高学习效率,为公安院校成人教育实训课程教学提供了一种新的教学模式。
关键词 公安成人教育 实训课程 教育信息化技术
下载PDF
法庭语音比对中话者自身变化性建模方法研究 被引量:2
13
作者 王华朋 姜囡 +1 位作者 刘恩 晁亚东 《计算机工程与应用》 CSCD 北大核心 2019年第8期110-115,214,共7页
针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人... 针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人员语音样本比较时的得分模型,以获得能反映说话人自身变化性的统计模型。基于目前最新的法庭证据评估的似然比证据强度评估体系,使用MFCC(Mel Frequency Cepstral Coefficients)和GFCC(Gammatone Frequency Cepstral Coefficients)特征对该方法的有效性进行了验证,并对上述特征进行了特征级和决策级融合。实验结果表明:该方法在纯净语音环境和噪声环境下都具有很高的识别率和稳定性,并且特征级融合能进一步提高识别系统的性能。 展开更多
关键词 似然比 证据强度 建模 梅尔频率倒谱系数(MFCC) 伽马通频率倒谱系数(GFCC)
下载PDF
噪声环境下法庭语音证据量化评价方法 被引量:2
14
作者 王华朋 姜囡 +1 位作者 晁亚东 刘恩 《计算机应用与软件》 北大核心 2019年第7期65-68,98,共5页
针对说话人自动识别系统的性能与稳定性在高噪声环境下会严重下降,人耳却能捕捉高噪声环境中的目标语音的问题。提出使用能模拟耳蜗听觉特性的GFCC(Gammatone Frequency Cepstral Coefficient)特征与主成分分析(Principal Component Ana... 针对说话人自动识别系统的性能与稳定性在高噪声环境下会严重下降,人耳却能捕捉高噪声环境中的目标语音的问题。提出使用能模拟耳蜗听觉特性的GFCC(Gammatone Frequency Cepstral Coefficient)特征与主成分分析(Principal Component Analysis,PCA)相结合的方法,以提高识别系统的鲁棒性。在不同程度信噪比的真实语音案件噪声条件下,对国际上最认可的基于似然比证据评估体系的法庭自动说话人识别系统的准确性和稳定性进行测试。实验结果显示:GFCC特征在多个程度的信噪比条件下,甚至信噪比为-20 dB的条件下,依然能保持较高的识别准确度和良好的稳定性,并能够提供可量化、可重复的证据强度值。 展开更多
关键词 GFCC 似然比 证据强度 科学证据 PCA
下载PDF
声纹识别特征MFCC的提取方法研究 被引量:21
15
作者 王华朋 杨洪臣 《中国人民公安大学学报(自然科学版)》 2008年第1期28-30,共3页
目的:研究声纹识别在人的个体生物特征识别中的应用。方法:利用符合人听觉特性的语音特征参量MFCC作为识别特征,并且在Matlab平台上对MFCC的提取算法进行了详细的阐述和程序设计。结果:在实际应用中取得了较高的识别率。结论:采用MFCC... 目的:研究声纹识别在人的个体生物特征识别中的应用。方法:利用符合人听觉特性的语音特征参量MFCC作为识别特征,并且在Matlab平台上对MFCC的提取算法进行了详细的阐述和程序设计。结果:在实际应用中取得了较高的识别率。结论:采用MFCC作为特征参数进行声纹识别,其正确率比用LPC等作为特征参数有较大的改善。 展开更多
关键词 声纹识别 MFCC 特征提取
下载PDF
基于自适应同源方差控制的法庭自动说话人识别
16
作者 王华朋 杨军 +1 位作者 吴鸣 许勇 《应用科学学报》 CAS CSCD 北大核心 2014年第6期582-587,共6页
提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法.为了更准确地评估嫌疑人的统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型信息,降低了对嫌疑人数据量大小的... 提出了自动说话人识别系统得分到法庭证据强度量化值似然比的转换方法.为了更准确地评估嫌疑人的统计模型,提出了自适应同源方差控制算法,该算法能自适应地融合来自参考人群和嫌疑人的同源语音得分模型信息,降低了对嫌疑人数据量大小的需求.与基本识别系统相比的测试结果表明,使用该算法的识别系统不但具有更优良的识别性能和可靠性,而且提高了语音证据对判别结论的支持强度. 展开更多
关键词 法庭自动说话人识别 背景模型-高斯混合模型 似然比 自适应同源方差控制
下载PDF
常见语音被编辑加工痕迹的检验方法 被引量:4
17
作者 王华朋 《警察技术》 2017年第3期54-56,共3页
随着录音证据的大量涌现和证据接纳制度的完善,法庭语音证据的真实性必须经过检验方可采纳。介绍了常见的语音被编辑加工后的痕迹特征,包括抹除类痕迹、剪切类痕迹、插入拼接类痕迹以及频响范围更改痕迹等,并针对上述各类编辑加工痕迹... 随着录音证据的大量涌现和证据接纳制度的完善,法庭语音证据的真实性必须经过检验方可采纳。介绍了常见的语音被编辑加工后的痕迹特征,包括抹除类痕迹、剪切类痕迹、插入拼接类痕迹以及频响范围更改痕迹等,并针对上述各类编辑加工痕迹给出了对应的检验方法。由于数字音频的易更改性和犯罪手段的提高,未来还需要更多、更先进的检验鉴定方法。 展开更多
关键词 语音 真实性 编辑加工 痕迹
下载PDF
数据缺失条件下法庭说话人确认研究
18
作者 王华朋 杨军 吴鸣 《电声技术》 2013年第1期57-61,65,共6页
为检验似然比证据评估框架下法庭半自动说话人识别系统在有限问题语音条件下的识别性能,提出了一种新的使用元音倒谱和高斯混合模型(GMM)的法庭说话人识别方法。该方法使用多个时期的普通话数据库中元音/a/的倒谱系数进行了验证,与多变... 为检验似然比证据评估框架下法庭半自动说话人识别系统在有限问题语音条件下的识别性能,提出了一种新的使用元音倒谱和高斯混合模型(GMM)的法庭说话人识别方法。该方法使用多个时期的普通话数据库中元音/a/的倒谱系数进行了验证,与多变量核密度(MVKD)的方法相比,基于GMM的方法在问题语音数据缺乏的情况下具有更好的识别性能。讨论和检验了多个似然比结果的融合方法,并且对识别系统的准确度使用对数似然比代价函数进行了衡量。 展开更多
关键词 法庭说话人识别 似然比 有限问题数据 高斯混合模型
下载PDF
特定频带扬声器频响补偿技术 被引量:4
19
作者 吴鸣 曹洁 +2 位作者 匡正 王华朋 杨军 《声学学报》 EI CSCD 北大核心 2010年第2期208-214,共7页
对于基于扬声器阵列的定向声技术,为了保证每个通道具有相同的频率响应,需要采用数字滤波器对每个扬声器单元进行频响补偿。通常采用的扬声器频响补偿技术都是在全频带进行,其对每个频率点的补偿性能具有相同权重。然而对于一些实际场合... 对于基于扬声器阵列的定向声技术,为了保证每个通道具有相同的频率响应,需要采用数字滤波器对每个扬声器单元进行频响补偿。通常采用的扬声器频响补偿技术都是在全频带进行,其对每个频率点的补偿性能具有相同权重。然而对于一些实际场合,有时只要求每个通道在某个特定频段具有相同频率响应,而对其他频段的频响补偿性能要求并不高。本文针对这一应用场景,结合多速率采样方法和滤波器优化设计方法,提出了特定频带的扬声器频响补偿技术。实验结果表明,采用该技术,在相同滤波器阶数下,大大提高了系统在指定频带的频响补偿性能。 展开更多
关键词 扬声器阵列 补偿技术 频响 频带 数字滤波器 优化设计方法 频率响应 补偿性能
下载PDF
自适应机翼的控制系统设计及其试验研究 被引量:3
20
作者 郑华 裴承鸣 +1 位作者 孙铁 王华朋 《西北工业大学学报》 EI CAS CSCD 北大核心 2006年第6期749-753,共5页
针对自适应机翼的特点和研制要求,研究了控制系统的设计与实现,较好地解决了飞行中机翼参数时变的问题,并使系统对控制律做了合理的约束,根据最优控制理论对具体方案进行了理论分析和物理试验。结果表明,采用具有辅助模型自适应控制理... 针对自适应机翼的特点和研制要求,研究了控制系统的设计与实现,较好地解决了飞行中机翼参数时变的问题,并使系统对控制律做了合理的约束,根据最优控制理论对具体方案进行了理论分析和物理试验。结果表明,采用具有辅助模型自适应控制理论的控制器能够有效、准确、快速地达到设计目标跟踪和设计状态回归两项重要指标,系统的鲁棒性、收敛性和稳定性都得到明显体现,且能很好地实现在线控制。 展开更多
关键词 自适应机翼 时变参数建模 自适应控制
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部