期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于胶囊网络的恶意评论检测
1
作者 李公瑾 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期452-459,共8页
针对传统恶意评论检测模型无法适应不断更新的网络文化和语言习惯以及神经网络丢失信息的问题,提出了一种基于胶囊网络的检测模型.首先,采用BERT模型提取词向量的特征,以保留文本的潜在语义信息;然后,通过胶囊网络在局部范围内提取特征... 针对传统恶意评论检测模型无法适应不断更新的网络文化和语言习惯以及神经网络丢失信息的问题,提出了一种基于胶囊网络的检测模型.首先,采用BERT模型提取词向量的特征,以保留文本的潜在语义信息;然后,通过胶囊网络在局部范围内提取特征表示,并结合Bi-LSTM在全局范围内提取特征表示,以获得更全面的特征表示;其次,利用注意力机制将局部和全局的特征表示进行融合,提取关键信息并降低特征表示的维度;最后,使用Sigmoid分类器对结果进行分类,并输出检测结果.实验结果表明,所提出的组合模型相对于传统模型能够提取到更精细的语义信息,有效地提高了分类效果,在恶意评论的检测任务中,准确度达到了0.922. 展开更多
关键词 恶意评论检测 胶囊网络 局部特征 全局特征
下载PDF
应用于噪声环境下语种识别的GFCC改进算法
2
作者 周大春 邵玉斌 +2 位作者 张昊阁 龙华 彭艺 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期246-254,共9页
不同的噪声在频谱上有不同的特点,使得自动语种识别的性能在噪声环境下显著下降.针对该问题,提出一种基于改进时域伽马通滤波器倒谱系数(gammatone filter cepstral coefficient,GFCC)特征的语种识别方法.首先,提取不同噪声背景下的训... 不同的噪声在频谱上有不同的特点,使得自动语种识别的性能在噪声环境下显著下降.针对该问题,提出一种基于改进时域伽马通滤波器倒谱系数(gammatone filter cepstral coefficient,GFCC)特征的语种识别方法.首先,提取不同噪声背景下的训练集的时域GFCC特征;然后,利用Fisher比计算特征各维对区分语种的相对贡献度大小,分析不同噪声对时域GFCC特征各维的影响,并根据分析来设计合适的权值对特征各维加权,得到语种区分性更强的特征集;最后,利用高斯混合-通用背景模型作为基线系统进行语种识别,以测试所提方法性能.实验结果表明,在单一噪声背景,信噪比为-5 dB,噪声源分别为粉红噪声、餐厅噪声的条件下,所提方法相比于传统时域GFCC特征方法的识别率分别提升了40.1、20.6个百分点,在其他噪声背景、信噪比下的识别率也有一定程度的提升. 展开更多
关键词 噪声环境 语种识别 时域伽马通滤波器 Fisher比
下载PDF
基于新闻文本图像的鲁棒水印算法
3
作者 刘尧 杜庆治 +3 位作者 马迪南 龙华 邵玉斌 黄喜阳 《现代电子技术》 北大核心 2024年第3期43-50,共8页
在新闻文本图像中,现有的水印算法没有将表达文本部分的区域与其他背景区域进行区分,并且对二值水印图像嵌入时只在单通道嵌入导致鲁棒性不高。针对以上问题,提出基于新闻文本图像的鲁棒水印算法。首先将新闻文本图像进行大津阈值分割(O... 在新闻文本图像中,现有的水印算法没有将表达文本部分的区域与其他背景区域进行区分,并且对二值水印图像嵌入时只在单通道嵌入导致鲁棒性不高。针对以上问题,提出基于新闻文本图像的鲁棒水印算法。首先将新闻文本图像进行大津阈值分割(OSTU),将文本与背景区域区分开,选择文本区域进行嵌入加深对重要信息的版权保护;接着将文本图像Cr和Cb通道的文本区域进行离散小波变换(DWT)后,利用主成分分析(PCA)进行能量集中并计算各主成分贡献率,通过比较贡献率来选择嵌入的主成分;最后对主成分及水印图像进行奇异值分解(SVD)完成水印嵌入。经过实验表明,嵌入水印图像在面对滤波等大多数常规攻击的NC值都在0.99以上,表明该算法有较强的鲁棒性,同时该算法在嵌入水印后图像的PSNR均值为45.66 dB,保证了不可感知性。 展开更多
关键词 图像水印 大津阈值分割 主成分分析 小波变换 奇异值分解 NC值
下载PDF
基于非线性语谱图联合判决的语种识别
4
作者 段云 邵玉斌 +1 位作者 龙华 杜庆治 《微电子学与计算机》 2024年第5期99-108,共10页
针对灰度对数语谱图对基频拉伸幅度过大,短时长语音识别率提升受限的问题,提出一种非线性语谱图联合判决的语种识别方法。首先,对语音进行能量归一化,提取对数功率谱,将频率刻度按照人耳听觉感知进行非线性映射得到非线性语谱图。然后,... 针对灰度对数语谱图对基频拉伸幅度过大,短时长语音识别率提升受限的问题,提出一种非线性语谱图联合判决的语种识别方法。首先,对语音进行能量归一化,提取对数功率谱,将频率刻度按照人耳听觉感知进行非线性映射得到非线性语谱图。然后,将非线性语谱图按词关联特性进行等间隔拆分,在ResNet网络后端加入联合判决层;输出语音所属语种类型。实验结果表明,所提方法有效改善灰度对数语谱图的缺点,识别性能均高于语谱图及改进特征。联合判决对切分时长为1.0 s的样本语音取得的识别效果最佳,在广播音频数据集中,识别率达到94.25%;在VoxForge公共语料集中,识别率达到98.94%。 展开更多
关键词 语种识别 语谱图 非线性 联合判决 神经网络
下载PDF
基于Arnold-DWT-QR的脆弱性图像水印算法
5
作者 黄喜阳 杜庆治 +3 位作者 马迪南 龙华 邵玉斌 刘尧 《陕西理工大学学报(自然科学版)》 2024年第1期65-72,共8页
在人物新闻图像中,人眼视觉更关注于人脸高频细节部分,为实现含水印的人物新闻图像受到任何微弱攻击情况下均不能完整提取出水印信息,且具有较好的不可感知性,提出了一种Arnold置乱结合离散小波变换(DWT)、正交三角分解法(QR)的脆弱性... 在人物新闻图像中,人眼视觉更关注于人脸高频细节部分,为实现含水印的人物新闻图像受到任何微弱攻击情况下均不能完整提取出水印信息,且具有较好的不可感知性,提出了一种Arnold置乱结合离散小波变换(DWT)、正交三角分解法(QR)的脆弱性图像水印算法。首先将水印图像进行Arnold置乱加密,再提取载体图像B通道中人眼不敏感的低频细节部分进行QR分解,最后将Arnold置乱加密后的水印图像QR分解后嵌入在载体图像矩阵R中每一个元素,使较少的水印信息均嵌入在载体图像的每一个像素中。实验结果表明,该算法在未受攻击情况下平均峰值信噪比(PSNR)为51 dB,归一化相关系数(NC)为1.0,在任何强度的攻击下均无法提取完整水印图像,具有较好的人物新闻图像认证能力。 展开更多
关键词 脆弱性图像水印 ARNOLD置乱 离散小波变换 QR分解 图像认证
下载PDF
噪声环境下听觉特征融合的语种识别 被引量:1
6
作者 黄张衡 龙华 +3 位作者 邵玉斌 杜庆治 苏树盟 王延凯 《现代电子技术》 2023年第5期47-54,共8页
针对单一信号特征CFCC与GFCC在低信噪比下识别率不高的问题,提出一种噪声环境下听觉特征融合的语种识别方法。在特征提取前端对含噪语音信号进行端点检测,然后结合谱减法与维纳滤波器对信号进行噪声滤除;再根据人耳听觉频率集中范围采... 针对单一信号特征CFCC与GFCC在低信噪比下识别率不高的问题,提出一种噪声环境下听觉特征融合的语种识别方法。在特征提取前端对含噪语音信号进行端点检测,然后结合谱减法与维纳滤波器对信号进行噪声滤除;再根据人耳听觉频率集中范围采用带通滤波器滤除高频以及低频中噪声,进一步减小噪声对信号特征提取的影响;提取GFCC融入CFCC构成融合特征,再采用主成分分析对融合特征进行降维处理;最后将处理后的融合特征通过频域注意力Fcanet网络模型进行分类识别。实验对比不同特征在不同信噪比下的性能实验表明,融合特征较单一特征语种识别率有显著提升,特别在0 dB信噪比下较单一特征GFCC和CFCC识别准确率分别提升了9.75%和11.08%,具有较强的鲁棒性。 展开更多
关键词 语种识别 信号端点检测 噪声滤除 带通滤波 特征提取 特征识别 降维处理
下载PDF
“揭榜挂帅”制在重点研发计划项目中的实践分析——以冬奥会手持火炬项目为例 被引量:1
7
作者 李堂军 杨帆 +1 位作者 邵宇宾 张巧显 《中国科技资源导刊》 2023年第3期26-32,共7页
科技项目实行“揭榜挂帅”,是国家科技管理体制机制改革的一项具有战略意义的重大举措。梳理分析我国古代历史案例、国际相关机制概况、国内实践探索的相关研究成果,阐释“揭榜挂帅”的理论内涵,总结“十三五”国家重点研发计划“揭榜... 科技项目实行“揭榜挂帅”,是国家科技管理体制机制改革的一项具有战略意义的重大举措。梳理分析我国古代历史案例、国际相关机制概况、国内实践探索的相关研究成果,阐释“揭榜挂帅”的理论内涵,总结“十三五”国家重点研发计划“揭榜挂帅”项目——“冬奥会手持火炬关键技术系统”项目的组织实施经验,并对重点研发计划项目实施“揭榜挂帅”制提出建议。 展开更多
关键词 科技项目 “揭榜挂帅” 科技管理体制机制改革 手持火炬 里程碑考核
下载PDF
基于倒谱图像的语音回声隐写分析方法
8
作者 唐军豪 杜庆治 +2 位作者 龙华 邵玉斌 李一民 《数据采集与处理》 CSCD 北大核心 2023年第6期1469-1481,共13页
语音信号回声隐写后其倒谱系数会在回声延迟出产生峰值,传统回声隐写分析主要采用倒谱系数的统计特征作为隐写检测特征,然而在低回声幅度时隐写信号倒谱系数的峰值并不明显,基于统计特征的方法检测性能并不理想。本文将倒谱分析与图像... 语音信号回声隐写后其倒谱系数会在回声延迟出产生峰值,传统回声隐写分析主要采用倒谱系数的统计特征作为隐写检测特征,然而在低回声幅度时隐写信号倒谱系数的峰值并不明显,基于统计特征的方法检测性能并不理想。本文将倒谱分析与图像识别技术结合,提出了一种基于倒谱图像的语音回声隐写分析方法,对语音信号分帧加窗后进行倒谱计算,然后以时间为横轴,倒谱序列点为纵轴,倒谱系数幅值为灰度级生成倒谱图像,将生成的倒谱图像作为隐写检测的输入,采用残差神经网络作为分类器进行回声隐写分析。实验结果表明,在3种经典回声隐写算法上低回声幅度时检测准确率分别达到98.2%、98.6%和96.1%,本文方法在低回声幅度时检测准确率相较传统回声隐写分析方法有较大提升,解决了传统回声隐写分析方法在低回声幅度检测效果不佳的问题。 展开更多
关键词 回声隐写 语音隐写分析 倒谱 图像识别 残差神经网络
下载PDF
面向战场环境下的语种识别
9
作者 华英杰 刘晶 +1 位作者 邵玉斌 朵琳 《兵工学报》 EI CAS CSCD 北大核心 2023年第7期2197-2206,共10页
为实现语种识别在战场环境下保持较高的识别性能,提出一种基于语谱图灰度变换的语种识别方法。根据语音信息和战场环境下的噪声信息在语谱图上的分布特性,引入带通滤波;根据人耳听觉特性提取对数灰度语谱图;采用自动色阶算法抑制语谱图... 为实现语种识别在战场环境下保持较高的识别性能,提出一种基于语谱图灰度变换的语种识别方法。根据语音信息和战场环境下的噪声信息在语谱图上的分布特性,引入带通滤波;根据人耳听觉特性提取对数灰度语谱图;采用自动色阶算法抑制语谱图上的噪声信息,增强语种信息,并采用残差神经网络模型进行训练识别。实验结果表明:在-10 dB掠夺者战斗机驾驶舱噪声环境下,相对于线性灰度语谱图特征,识别正确率提升了46%;在其他噪声环境下,识别性能也大幅度提升。 展开更多
关键词 语种识别 对数灰度语谱图 自动色阶算法 残差神经网络
下载PDF
一种基音频率归一化的语种识别方法
10
作者 段云 邵玉斌 +2 位作者 刘晶 龙华 杜庆治 《微电子学与计算机》 2023年第5期20-28,共9页
针对说话人发音特征影响语种辨识,导致识别性能不佳的问题,提出一种语音基音频率归一化的语种识别方法.首先,根据端点检测区分出语音中的有话段和无话段,并在有话段中提取基音频率并进行归一化处理产生声门脉冲.其次,提取声道响应,将声... 针对说话人发音特征影响语种辨识,导致识别性能不佳的问题,提出一种语音基音频率归一化的语种识别方法.首先,根据端点检测区分出语音中的有话段和无话段,并在有话段中提取基音频率并进行归一化处理产生声门脉冲.其次,提取声道响应,将声门脉冲和声道响应通过全极点滤波器重构出基音频率归一化的语音,最后,提取底层声学特征在ResNet网络中进行后端语种识别验证.实验结果表明,所提方法可以降低说话人发音特征对语种区分特征的影响,在灰度语谱图中效果显著,识别率达到94.3%.对MFCC、GFCC等传统底层声学特征以及改进的时域GF特征进行识别验证,所提方法的识别率均有3~4%幅度的提升.有效减小了说话人发音特征的影响,提高了语种识别性能. 展开更多
关键词 语种识别 归一化 语音重构 基音频率 神经网络
下载PDF
极早熟大豆品种蒙豆343选育报告
11
作者 邵玉彬 孙宾成 +6 位作者 胡兴国 张琪 王景顺 郭荣起 孙如建 柴燊 冯雷 《中国种业》 2023年第11期152-153,共2页
极早熟大豆品种蒙豆343是呼伦贝尔市农牧科学研究所2005年以内豆4号为母本、黑交96-1030为父本杂交经系谱法选择育成,2022年通过审定,审定编号:蒙审豆2022001号,命名为蒙豆343。2023年取得植物新品种权(CNA20211009426)。适应种植区域... 极早熟大豆品种蒙豆343是呼伦贝尔市农牧科学研究所2005年以内豆4号为母本、黑交96-1030为父本杂交经系谱法选择育成,2022年通过审定,审定编号:蒙审豆2022001号,命名为蒙豆343。2023年取得植物新品种权(CNA20211009426)。适应种植区域为内蒙古自治区出苗至成熟≥10℃活动积温1960℃以上地区及国内类似生态区。 展开更多
关键词 大豆 品种 蒙豆343 极早熟
下载PDF
基于Labeled-LDA模型的文本特征提取方法 被引量:13
12
作者 王瑞 龙华 +1 位作者 邵玉斌 杜庆治 《电子测量技术》 2020年第1期141-146,共6页
针对LDA主题模型文本特征提取时主题识别不明确的问题,提出一种基于Labeled-LDA模型的文本特征提取方法。使用LDA主题模型对文本隐含主题中的主题词进行提取,根据TF-IDF算法实现对文本类别的关键词进行提取。通过文本simhash算法对提取... 针对LDA主题模型文本特征提取时主题识别不明确的问题,提出一种基于Labeled-LDA模型的文本特征提取方法。使用LDA主题模型对文本隐含主题中的主题词进行提取,根据TF-IDF算法实现对文本类别的关键词进行提取。通过文本simhash算法对提取出的主题词与关键词进行相似度计算,找到文本隐含主题的类别并提取特征词。实验表明结合后的特征提取方法比TF-IDF、传统LDA主题模型的文本特征提取方法,获得更高的分类精度,其中准确度提高了3.40%,召回率提高了4.40%,F值提高了3.92%。 展开更多
关键词 Labeled-LDA TF-IDF Simhash 文本特征提取
下载PDF
基于倒谱分析的实时广播音频相似度快速比对算法 被引量:4
13
作者 邵玉斌 唐传林 +2 位作者 赵至柔 龙华 杜庆治 《工程科学与技术》 EI CAS CSCD 北大核心 2020年第3期178-185,共8页
为了解决广播音频中经常存在噪声干扰和时间延迟导致音频比对结果不准确的问题,提出具有延时自适应意识的音频比对算法。针对常用算法中测量音频特征距离抗噪性能差的不足,采用倒谱对两音频的混合信号分析,并利用倒谱对功率谱中的等距... 为了解决广播音频中经常存在噪声干扰和时间延迟导致音频比对结果不准确的问题,提出具有延时自适应意识的音频比对算法。针对常用算法中测量音频特征距离抗噪性能差的不足,采用倒谱对两音频的混合信号分析,并利用倒谱对功率谱中的等距离频率成分有很强的分辨能力这一特性来进行自适应延时估计和比对;为比对不同情况的两音频都可得到准确的相似度,提出对其中一音频加入短延时,再将两音频叠加混合后做倒谱分析;并根据加入不同短延时的效果选择出最优短延时,进一步提升算法性能。使用真实广播不同节目中截取出来的多个音频,在无噪声和不同信噪比加性高斯白噪声条件下,通过仿真实验评估了所提出算法的性能,比较了不同信噪比下的延时估计结果和音频相似度。实验结果证明,所提出方法的延时估计结果和比对结果优于现有算法,在低信噪比(SNR=2 dB)下,也可以达到90.36%的音频比对匹配精度,且计算速度能够达到实时比对的要求。 展开更多
关键词 音频比对 延时估计 倒谱分析 实时广播音频
下载PDF
面向战场环境下的语音传输与重构 被引量:1
14
作者 邵玉斌 刘晶 +1 位作者 龙华 李一民 《兵工学报》 EI CAS CSCD 北大核心 2022年第11期2827-2835,共9页
针对语音在高压缩比及低信噪比下传输与重构质量不佳的问题,提出一种基于语谱图的语音压缩传输重构方法。在发送端将语音信号转为语谱图进行传输,再在接收端对语谱图作图像去噪处理,根据去噪后的图像恢复出语音信号的幅度谱;建立发声重... 针对语音在高压缩比及低信噪比下传输与重构质量不佳的问题,提出一种基于语谱图的语音压缩传输重构方法。在发送端将语音信号转为语谱图进行传输,再在接收端对语谱图作图像去噪处理,根据去噪后的图像恢复出语音信号的幅度谱;建立发声重构模型,用幅度谱对语音信号进行重构,实现语音恢复。实验结果表明:无噪声环境下,压缩比为10和40的条件下,重构语音质量客观平均得分达到3分以上;低信噪比条件下,压缩比为10时,重构语音质量客观平均得分也能达到2分以上。相比于传统的压缩感知语音重构算法,在高压缩比下,新方法对重构语音质量有明显改善。 展开更多
关键词 语音传输与重构 图像增强 发声重构模型 压缩比及低信噪比
下载PDF
基于改进GFCC特征参数的广播音频语种识别 被引量:1
15
作者 邵玉斌 陈亮 +1 位作者 龙华 杜庆治 《吉林大学学报(理学版)》 CAS 北大核心 2022年第2期417-424,共8页
针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦... 针对广播音频语种识别中与语种识别无关的特征对识别结果产生影响的问题,提出一种基于伽马频率倒谱系数的改进特征参数的语种识别方法.通过提取每帧信号的能量谱包络,去除部分与说话人相关的特征,采用Gammatone滤波器组滤波,经离散余弦变换后再进行倒谱提升,得到改进的伽马频率倒谱系数特征参数.将广播音频信号提取特征参数输入隐Markov模型中进行训练测试,得到的语种识别结果表明,该方法有效提升了广播音频语种识别的准确率,优于目前使用的伽马频率倒谱系数特征及其衍生方法. 展开更多
关键词 广播音频语种识别 能量谱包络 倒谱提升 改进伽马频率倒谱系数
下载PDF
基于改进CFCC特征提取的语种识别算法研究
16
作者 龙华 黄张衡 +2 位作者 邵玉斌 杜庆治 苏树盟 《通信学报》 EI CSCD 北大核心 2022年第12期211-221,共11页
针对在低信噪比下语种识别准确率低的问题,提出一种基于分数阶小波变换的语种识别算法。首先,在特征提取前端采用自适应滤波法对带噪信号进行噪声滤除,以减小噪声对特征提取的影响,提升系统对带噪信号的处理能力。其次,采用新型分数阶... 针对在低信噪比下语种识别准确率低的问题,提出一种基于分数阶小波变换的语种识别算法。首先,在特征提取前端采用自适应滤波法对带噪信号进行噪声滤除,以减小噪声对特征提取的影响,提升系统对带噪信号的处理能力。其次,采用新型分数阶小波变换作为小波基函数来模拟信号在耳蜗基底膜上的传播过程,利用非线性幂函数对信号进行压缩处理。最后,通过模拟人耳听觉过程提取改进耳蜗滤波器倒谱系数(CFCC)。实验结果表明,改进CFCC与传统CFCC相比显著提升了语种识别准确率,在0dB信噪比下语种识别准确率平均提升了11.1%,充分验证了所提算法的有效性和稳健性。 展开更多
关键词 语种识别 自适应滤波 分数阶小波变换 神经网络 耳蜗滤波器倒谱系数
下载PDF
基于特征向量和笔顺编码的字形相似算法研究 被引量:8
17
作者 祁俊辉 龙华 +1 位作者 邵玉斌 杜庆治 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2019年第6期885-891,共7页
为充分利用汉字结构、轮廓、笔画、书写顺序等特征识别相似汉字,提出基于特征向量和笔顺编码的字形相似算法,用以解决形近字检索中准确度不高的问题.算法采用图像处理方法及五笔编码规则将汉字转化为特征向量形式和笔顺编码字符串,引入... 为充分利用汉字结构、轮廓、笔画、书写顺序等特征识别相似汉字,提出基于特征向量和笔顺编码的字形相似算法,用以解决形近字检索中准确度不高的问题.算法采用图像处理方法及五笔编码规则将汉字转化为特征向量形式和笔顺编码字符串,引入二值化差值算法和改进后的Jaro-Winkler Distance算法分别对其进行相似度计算,2个相似度分别从不同方面反映汉字的相似程度,吸取2种方法的优势对其进行融合,得到最终字形相似度.实验结果表明,该算法在字形检索中较3元组递归算法准确率提高27.8%,较模板匹配算法、结构方法、神经网络算法执行效率平均提高约66.7%,该算法不仅可以有效解决形近字检索中的准确性问题,同时效率也得以优化. 展开更多
关键词 特征向量 笔顺编码 差值算法 形近字检索
下载PDF
基于并行双向门控循环单元与自注意力机制的中文文本情感分类 被引量:4
18
作者 崔昕阳 龙华 +2 位作者 熊新 邵玉斌 杜庆治 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第2期115-123,共9页
在基于深度学习的文本情感分类研究领域中,目前传统的模型主要是序列结构,即采用单一的预训练词向量来表示文本从而作为神经网络的输入,然而使用某一种预训练的词向量会存在未登录词和词语语义学习不充分的问题。针对此问题,提出基于并... 在基于深度学习的文本情感分类研究领域中,目前传统的模型主要是序列结构,即采用单一的预训练词向量来表示文本从而作为神经网络的输入,然而使用某一种预训练的词向量会存在未登录词和词语语义学习不充分的问题。针对此问题,提出基于并行双向门控循环单元(gated recurrent unit,GRU)网络与自注意力机制的文本情感分类模型,利用两种词向量对文本进行表示并作为并行双向GRU网络的输入,通过上下两个通道分别对文本进行上下文信息的捕捉,得到表征向量,再依靠自注意力机制学习词语权重并加权,最后对两个通道的输出向量进行向量融合,作为输入进入全连接层判别情感倾向。将本文模型与多个传统模型在两个公共数据集上进行实验验证,结果表明本文模型在查准率、查全率、F1值和准确率等性能指标上相比于双向门控循环单元网络模型、双向长短时记忆网络模型和双向门控循环单元网络与自注意力机制的单通道网络模型均有所提升。 展开更多
关键词 双向门控循环单元 词向量 自注意力机制 情感分类
下载PDF
基于时域Gammatone滤波特征的广播语种识别 被引量:3
19
作者 陈亮 邵玉斌 +3 位作者 龙华 杜庆治 彭艺 唐维康 《信号处理》 CSCD 北大核心 2022年第3期599-608,共10页
针对广播语种识别问题,提出一种语音时域滤波方法,用gammatone时域函数与预处理后的语音信号进行卷积滤波,再分帧加窗并求对数化能量得到时域GF(gammatone filterbank)特征。将特征参数图像化表示,然后通过VGG19和Resnet34分类网络进行... 针对广播语种识别问题,提出一种语音时域滤波方法,用gammatone时域函数与预处理后的语音信号进行卷积滤波,再分帧加窗并求对数化能量得到时域GF(gammatone filterbank)特征。将特征参数图像化表示,然后通过VGG19和Resnet34分类网络进行语种识别实验。同时,也使用自动色阶算法对加噪语音的图像化特征参数进行去噪,并对比不同维数的特征参数以及不同噪声类型和信噪比对语种识别率的影响。结果表明,采用该特征参数的广播语种识别准确率高于使用传统的GFCC特征、GFCC-D-A特征、GFCC-SDC特征及Fbank特征,且在不同噪声类型和不同信噪比的广播语音识别场景下,语种识别准确率均有一定提升。 展开更多
关键词 广播语种识别 gammatone时域滤波 时域gammatone filterbank 自动色阶算法
下载PDF
基于物理特征的音频相似度比对算法研究 被引量:9
20
作者 张琳 周韬 +2 位作者 杜庆治 邵玉斌 龙华 《电视技术》 北大核心 2017年第11期110-114,共5页
针对电台播音需要将来自卫星的声音与拟发射的声音一致以保证播音安全,提出了一种基于物理特征的音频相似度比对算法。算法通过提取波形、包络、过零率等特征参数进行音频信号相似性的比较,并对比较结果进行融合,得出在不同环境下的待... 针对电台播音需要将来自卫星的声音与拟发射的声音一致以保证播音安全,提出了一种基于物理特征的音频相似度比对算法。算法通过提取波形、包络、过零率等特征参数进行音频信号相似性的比较,并对比较结果进行融合,得出在不同环境下的待测音频相似性比较的优化方法,实验表明了该方法的有效性。 展开更多
关键词 相似度 物理特征 波形 包络 过零率
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部