期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于功率谱包络动态分割的鲁棒语音端点检测 被引量:1
1
作者 许春冬 王晶 +3 位作者 战鸽 应冬文 李军锋 颜永红 《北京理工大学学报》 EI CAS CSCD 北大核心 2015年第11期1189-1193,共5页
在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语... 在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语音的频谱包络在时间维度上分割成具有特征同一性的时间块,以分割块为单位计算能量特征,并进行语音/非语音决策,从而达到提高语音端点检测的稳定性目的.实验表明,提出的方法有效提高了语音端点检测的鲁棒性. 展开更多
关键词 语音端点检测 动态分割 聚类 最小描述长度准则
下载PDF
语音同一认定中音段长度对基频分析的影响
2
作者 刘贻杰 李江春 +1 位作者 陈维娜 黄颀涵 《中国人民公安大学学报(自然科学版)》 2022年第1期14-20,共7页
就音段选取长度对基频分析的影响进行实验研究,旨在尝试为语音同一认定中的基频分析提供更可靠的指标。实验从单音节字、多音节词、句子、语段4个音段长度对20位志愿者的录音进行了基频分析,使用方差均值比分析个体稳定性,使用皮尔逊相... 就音段选取长度对基频分析的影响进行实验研究,旨在尝试为语音同一认定中的基频分析提供更可靠的指标。实验从单音节字、多音节词、句子、语段4个音段长度对20位志愿者的录音进行了基频分析,使用方差均值比分析个体稳定性,使用皮尔逊相关性检验初步分析人间差异性,并使用欧氏距离进一步对句子、语段的基频进行综合分析。结果发现,单音节字、多音节词的个人稳定性和人间差异性较差,不适用于基频分析,而句子、语段的基频均值稳定性较强,且综合使用均值、最小值和最大值时发音个体间的差异相对更明显。研究结果表明,截取句子、语段等长时音段进行综合的基频分析,更适用于语音同一认定。 展开更多
关键词 语音同一认定 音段长度 基频分析 个体稳定性 人间差异性
下载PDF
基于深度学习可变长度语音片段的情感识别 被引量:1
3
作者 魏金太 高穹 《承德石油高等专科学校学报》 CAS 2021年第6期51-56,共6页
通过将深度神经网络直接应用于频谱图,提出了一种用于可变长度语音段的情感识别方法。频谱图包含对情绪识别有用的对话语言信息。从频谱图中提取这些信息,并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务。与传... 通过将深度神经网络直接应用于频谱图,提出了一种用于可变长度语音段的情感识别方法。频谱图包含对情绪识别有用的对话语言信息。从频谱图中提取这些信息,并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务。与传统的将句子分割成更小的固定长度段的方法相比,该方法可以解决语音分割过程中引入的准确性降低问题。实验结果表明,该方法在加权精度(WA)和不加权精度(UA)上均优于定长神经网络。 展开更多
关键词 语音情感识别 可变长度语音片段 频谱图 深度神经网络
下载PDF
基于子带能量分析的数字接收机数据语音段识别方法研究
4
作者 黄均安 詹毅 《软件导刊》 2019年第1期162-165,共4页
在无线电侦听领域,侦听数据中常常含有纯噪音、误判为语音的定频数字调制信号等非语音信号段,造成侦听人员工作效率下降。针对该问题,提出一种基于子带能量分析的语音段识别算法。考虑到侦听数据在时域上存在幅度跳变现象,首先利用直方... 在无线电侦听领域,侦听数据中常常含有纯噪音、误判为语音的定频数字调制信号等非语音信号段,造成侦听人员工作效率下降。针对该问题,提出一种基于子带能量分析的语音段识别算法。考虑到侦听数据在时域上存在幅度跳变现象,首先利用直方图分析对侦听数据进行分段,得到若干个子数据段,然后对每个子数据段进行子带能量分析,最后提取特征参数实现对语音段的识别。仿真结果表明,该方法能够准确地对侦听数据进行分段,并识别出其中的语音段。 展开更多
关键词 纯噪音 定频数字调制信号 子带能量 语音段识别 无线电侦听
下载PDF
基于韵律语段的语音情感识别方法研究 被引量:8
5
作者 韩文静 李海峰 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期1363-1368,共6页
语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造... 语音情感识别领域提取情感特征时,普遍采用"不同情感类别,相同时长基准"的做法,忽略了人耳敏感的韵律段长会依情感不同而有所差异的现象。本文首先通过情感识别实验确定各类情感的最佳识别段长,作为人耳敏感韵律段长。并构造了基于韵律段特征的多重Elman网络模型,以期对不同情感基于特定敏感韵律段长进行识别和对多分类器识别结果进行有效融合,实现了对人耳情感辨识规律的模拟。结果表明,使用敏感韵律段特征的系统识别率达到67.9%,与使用定长语段特征相比有了很大的提高。 展开更多
关键词 情感特征 敏感韵律段长 语段特征 ELMAN神经网络 语音情感识别
原文传递
基于深度学习可变长度语音片段的情感识别
6
作者 魏金太 高穹 《装备制造与教育》 2021年第1期47-51,共5页
通过将深度神经网络直接应用于频谱图,提出了一种用于可变长度语音段的情感识别方法。频谱图包含对情绪识别有用的对话语言信息。从频谱图中提取这些信息,并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务。与传... 通过将深度神经网络直接应用于频谱图,提出了一种用于可变长度语音段的情感识别方法。频谱图包含对情绪识别有用的对话语言信息。从频谱图中提取这些信息,并通过将卷积神经网络(CNN)与递归神经网络(RNN)相结合来完成情感识别任务。与传统的将句子分割成更小的固定长度段的方法相比,该方法可以解决语音分割过程中引入的准确性降低问题。实验结果表明,该方法在加权精度(WA)和不加权精度(UA)上均优于定长神经网络。 展开更多
关键词 语音情感识别 变长语音片段 频谱图 深度神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部