期刊文献+
共找到227篇文章
< 1 2 12 >
每页显示 20 50 100
Speech Endpoint Detection in Noisy Environments Using EMD and Teager Energy Operator 被引量:4
1
作者 De-Xiang Zhang Xiao-Pei Wu Zhao Lv 《Journal of Electronic Science and Technology》 CAS 2010年第2期183-186,共4页
Accurate endpoint detection is a necessary capability for speech recognition. A new energy measure method based on the empirical mode decomposition (EMD) algorithm and Teager energy operator (TEO) is proposed to l... Accurate endpoint detection is a necessary capability for speech recognition. A new energy measure method based on the empirical mode decomposition (EMD) algorithm and Teager energy operator (TEO) is proposed to locate endpoint intervals of a speech signal embedded in noise. With the EMD, the noise signals can be decomposed into different numbers of sub-signals called intrinsic mode functions (IMFs), which is a zero-mean AM-FM component. Then TEO can be used to extract the desired feature of the modulation energy for IMF components. In order to show the effectiveness of the proposed method, examples are presented to show that the new measure is more effective than traditional measures. The present experimental results show that the measure can be used to improve the performance of endpoint detection algorithms and the accuracy of this algorithm is quite satisfactory and acceptable. 展开更多
关键词 Index Terms----Empirical mode decomposition endpoint detection noisy speech Teager energy operator.
下载PDF
A recursive calculating algorithm for higher-order cumulants over sliding window and its application in speech endpoint detection 被引量:5
2
作者 LUO Yaqin WU Xiaopei +2 位作者 L Zhao PENG Kui GUI Yajun 《Chinese Journal of Acoustics》 CSCD 2015年第4期436-449,共14页
Regarding the performance of traditional endpoint detection algorithms degrades as the environment noise level increases, a recursive calculating algorithm for higher-order cu- mulants over a sliding window is propose... Regarding the performance of traditional endpoint detection algorithms degrades as the environment noise level increases, a recursive calculating algorithm for higher-order cu- mulants over a sliding window is proposed. Then it is applied to the speech endpoint detection. Furthermore, endpoint detection is carried out with the feature of energy. Experimental results show that both the computational efficiency and the robustness against noise of the proposed algorithm are improved remarkably compared with traditional algorithm. The average prob- ability of correct point detection (Pc-point) of the proposed voice activity detection (VAD) is 6.07% higher than that of G.729b VAD in different noisy at different signal-noise ratios (SNRs) environments. 展开更多
关键词 A recursive calculating algorithm for higher-order cumulants over sliding window and its application in speech endpoint detection OVER
原文传递
Speech endpoint detection in low-SNRs environment based on perception spectrogram structure boundary parameter 被引量:9
3
作者 WU Di ZHAO Heming +4 位作者 HUANG Chengwei XIAO Zhongzhe ZHANG Xiaojun XU Yishen TAO Zhi 《Chinese Journal of Acoustics》 2014年第4期428-440,共13页
The Perception Spectrogram Structure Boundary(PSSB)parameter is proposed for speech endpoint detection as a preprocess of speech or speaker recognition.At first a hearing perception speech enhancement is carried out... The Perception Spectrogram Structure Boundary(PSSB)parameter is proposed for speech endpoint detection as a preprocess of speech or speaker recognition.At first a hearing perception speech enhancement is carried out.Then the two-dimensional enhancement is performed upon the sound spectrogram according to the difference between the determinacy distribution characteristic of speech and the random distribution characteristic of noise.Finally a decision for endpoint was made by the PSSB parameter.Experimental results show that,in a low SNR environment from-10 dB to 10 dB,the algorithm proposed in this paper may achieve higher accuracy than the extant endpoint detection algorithms.The detection accuracy of 75.2%can be reached even in the extremely low SNR at-10 dB.Therefore it is suitable for speech endpoint detection in low-SNRs environment. 展开更多
关键词 speech endpoint detection in low-SNRs environment based on perception spectrogram structure boundary parameter
原文传递
ENDPOINT DETECTOR OF NOISY SPEECH SIGNAL USING A RECURRENT NEURAL NETWORK
4
作者 韦晓东 胡光锐 《Journal of Shanghai Jiaotong university(Science)》 EI 1999年第1期60-63,共4页
IntroductionEndpointdetectionofspeechsignalisimportantinmanyareasofspeechprocessingtechnology,suchasspeechen... IntroductionEndpointdetectionofspeechsignalisimportantinmanyareasofspeechprocessingtechnology,suchasspeechenhancement,speechr... 展开更多
关键词 speech endpoint detection RECURRENT NEURAL network(RNN) immunity learning
下载PDF
基于MFCC提取和DTW优化的连续音频识别算法设计
5
作者 王鸿瑞 张玉辰 +2 位作者 陈鹭 高博韬 高昕悦 《中国现代教育装备》 2024年第17期41-45,52,共6页
介绍了一种新型的利用梅尔频率倒谱系数(MFCC)提取和动态时间规整技术(DTW)优化的连续音频识别算法。首先对数学原理与算法步骤进行设计与规划,使用大规模音频数据库进行预处理,经过时域和频域分析提取相应的特征;然后利用双门限法把连... 介绍了一种新型的利用梅尔频率倒谱系数(MFCC)提取和动态时间规整技术(DTW)优化的连续音频识别算法。首先对数学原理与算法步骤进行设计与规划,使用大规模音频数据库进行预处理,经过时域和频域分析提取相应的特征;然后利用双门限法把连续音频切分为不同的音频块,并对切分部分进行针对性识别,将其与时频域数据库的模板进行匹配比对,实现了较好的连续音频识别效果,在时域和频域识别上的准确性均能达到89%。该研究成果可应用于钢琴教学系统的开发,尤其是在辅助学习者正确弹出曲谱方面具有广阔的应用前景。 展开更多
关键词 语音识别 端点检测 梅尔频率倒谱系数 动态时间规整算法 时频域分析
下载PDF
基于语音特征与MFCC谱图融合模型的抑郁症检测
6
作者 林靖宇 郑宜荣 郑贤伟 《计算机应用文摘》 2024年第19期129-130,134,共3页
据《2022年国民抑郁症蓝皮书》显示,我国的抑郁症患者人数接近1亿。为更好地实现抑郁症辅助检测,文章首先利用MFPH端点检测方法分离了语音信号的有声段、无声段,其次提取了停顿时长、停顿次数、短时过零率等语音特征及MFCC特征谱图。对... 据《2022年国民抑郁症蓝皮书》显示,我国的抑郁症患者人数接近1亿。为更好地实现抑郁症辅助检测,文章首先利用MFPH端点检测方法分离了语音信号的有声段、无声段,其次提取了停顿时长、停顿次数、短时过零率等语音特征及MFCC特征谱图。对比分析发现,基于语音特征与MFCC特征谱图的融合模型在测试集上的准确率可以达到76.4%。 展开更多
关键词 抑郁症 MFPH端点检测 语音特征 MFCC
下载PDF
民族语言的语音识别研究
7
作者 袁子林 张瑞 +2 位作者 张彩霞 魏欢 巩海平 《计算机应用文摘》 2024年第1期81-83,共3页
民族语言语音识别的研究内容主要涵盖连续语音识别、孤立词识别以及语音端点检测等方面。文章旨在挖掘和总结有关藏族、苗族和蒙古族语音识别的文献,分析这三种民族语言语音识别研究所面临的主要难点和研究趋势。
关键词 语音识别 民族语言 端点检测
下载PDF
基于梅尔频率倒谱系数的语音清晰度DRT识别
8
作者 马成龙 焦俊清 +4 位作者 焦富清 王杰 陈巧特 谢武俊 李军 《信息化研究》 2024年第2期63-68,共6页
语音清晰度在通信终端、设备系统语音识别方面具有重要意义。本文对110dB噪声干扰下采集到的语音信号进行谱减法降噪,双门限端点检测提取发音字段,然后提取梅尔频率倒谱系数(MFCC),再将其进行差分计算,得到一阶和二阶分量,结合短时能量... 语音清晰度在通信终端、设备系统语音识别方面具有重要意义。本文对110dB噪声干扰下采集到的语音信号进行谱减法降噪,双门限端点检测提取发音字段,然后提取梅尔频率倒谱系数(MFCC),再将其进行差分计算,得到一阶和二阶分量,结合短时能量作为语音信号的特征参数,最后通过动态时间归整(DTW)进行相似度识别。实验表明,本文算法对汉语清晰度诊断押韵测试(DRT)字表的测试结果高达92.90%,有良好的识别率。 展开更多
关键词 语音清晰度 谱减法 端点检测 梅尔频率倒谱系数 动态时间归整 汉语清晰度诊断押韵测试
下载PDF
基于Speech SDK的数字语音识别系统研究 被引量:2
9
作者 刘春平 《工业控制计算机》 2012年第7期69-70,共2页
为了较好地实现数字语音识别,运用隐式马尔科夫理论研究数字语音识别系统,通过软件编程研究其在语音识别系统中的应用。在VC++6.0环境下,该系统实现了汉语数字语音的识别。实验结果表明,其达到了较高的识别率。
关键词 端点检测 隐马尔科夫模型 语音识别系统 MEL倒谱系数
下载PDF
不完全匹配的语音和文本语句级对齐 被引量:1
10
作者 徐锴 陶冶 李辉 《计算机系统应用》 2023年第4期300-307,共8页
语音文本自动对齐技术广泛应用于语音识别与合成、内容制作等领域,其主要目的是将语音和相应的参考文本在语句、单词、音素等级别的单元进行对齐,并获得语音与参考文本之间的时间对位信息.最新的先进对齐方法大多基于语音识别,一方面,... 语音文本自动对齐技术广泛应用于语音识别与合成、内容制作等领域,其主要目的是将语音和相应的参考文本在语句、单词、音素等级别的单元进行对齐,并获得语音与参考文本之间的时间对位信息.最新的先进对齐方法大多基于语音识别,一方面,准确率受限于语音识别效果,识别字错误率高时文语对齐精度明显下降,识别字错误率对对齐精度影响较大;另一方面,这种对齐方法不能有效处理不完全匹配的长篇幅语音和文本的对齐.该文提出一种基于锚点和韵律信息的文语对齐方法,通过基于边界锚点加权的片段标注将语料划分为对齐段和未对齐段,针对未对齐段使用双门限端点检测方法提取韵律信息,并检测语句边界,降低了基于语音识别的对齐方法对语音识别效果的依赖程度.实验结果表明,与目前先进的基于语音识别的文语对齐方法比较,即使在识别字错误率为0.52时,该文所提方法的对齐准确率仍能提升45%以上;在音频文本不匹配程度为0.5时,该文所提方法能提高3%. 展开更多
关键词 语音文本对齐 韵律信息 锚点 自动语音识别 端点检测
下载PDF
连续汉语语音的自动切分研究
11
作者 李琦 张二华 《计算机与数字工程》 2023年第4期959-964,共6页
连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱... 连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱域等多个层次对连续语音信号进行分析,结合端点检测技术、频谱分析和倒等方法对音节切分点进行检测,研究了一种连续语音多级切分方法。相比传统的基于双门限和倒谱的端点检测方法,该方法将单字切分的正确率达到了92.8%。 展开更多
关键词 语音切分 端点检测 语谱图 双门限法 频带能量
下载PDF
适用于短波信号侦察的话音端点检测方法
12
作者 张洪德 韩鑫怡 《陆军工程大学学报》 2023年第1期63-70,共8页
针对传统话音端点检测方法在短波低信噪比信道下检测准确率低的问题,提出一种将深度生成对抗网络和自适应参数的子带对数能熵积相结合的话音端点检测方法。该方法首先利用深度生成对抗网络话音增强方法降低噪声对待检测信号的影响,再以... 针对传统话音端点检测方法在短波低信噪比信道下检测准确率低的问题,提出一种将深度生成对抗网络和自适应参数的子带对数能熵积相结合的话音端点检测方法。该方法首先利用深度生成对抗网络话音增强方法降低噪声对待检测信号的影响,再以自适应参数的子带对数能熵积这一新的话音特征参数为阈值,使用自适应阈值双门限检测法完成话音端点检测。仿真实验结果表明,该方法对于-5 dB信噪比的标准话音库检测的平均加权错误测度仅为13.5%,而对于实际短波侦察信号库检测的平均加权错误测度为16.7%,均优于能零熵法和多窗谱估计谱减与能熵积法。 展开更多
关键词 深度生成对抗网络 话音增强 话音端点检测 对数能量 谱熵
下载PDF
数字语音降噪系统实现研究
13
作者 宋飞 范焜 +1 位作者 张昊宇 朱泳翔 《西安航空学院学报》 2023年第5期54-59,共6页
在短波语音通信场景下,基于梅尔倒谱距离的语音端点检测与谱减法降噪和有效的滤波器滤波相结合研究了数字语音降噪系统设计方案。经过对实际采集的带噪语音处理分析,该方案既能够高效实现对强背景噪声的降噪处理,又能够有效抑制“音乐... 在短波语音通信场景下,基于梅尔倒谱距离的语音端点检测与谱减法降噪和有效的滤波器滤波相结合研究了数字语音降噪系统设计方案。经过对实际采集的带噪语音处理分析,该方案既能够高效实现对强背景噪声的降噪处理,又能够有效抑制“音乐噪声”的影响,算法简洁,资源利用率较高,适合于在可移动的短波接收机的嵌入式芯片中实现。 展开更多
关键词 梅尔倒谱距离 语音端点检测 谱减法降噪 短波语音通信
下载PDF
一种改进的自适应子带谱熵语音端点检测方法 被引量:26
14
作者 刘华平 李昕 +2 位作者 郑宇 徐柏龄 姜宁 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第5期1366-1371,共6页
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。自适应子带谱熵法是一种新的端点检测方法,它的思想是将一帧语音分成若干个子带,再用谱熵法进行运算,子带的个数可以自适应选择。该方法具有一定的稳健性,但随着信噪比的... 噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。自适应子带谱熵法是一种新的端点检测方法,它的思想是将一帧语音分成若干个子带,再用谱熵法进行运算,子带的个数可以自适应选择。该方法具有一定的稳健性,但随着信噪比的降低,语音端点检测的准确性也随之下降。提出了一种结合加权功率谱减的子带自适应谱熵法,并给出了该方法的实现步骤。该方法采用边降噪边用稳健性好的特征参数做语音端点检测,从两个方面来提高端点检测的准确性。实验结果表明该方法具有良好的性能,在不同信噪比的不同加性噪声下系统识别率都有提高。 展开更多
关键词 语音端点检测 加权功率谱减法 自适应子带谱熵 鲁棒性
下载PDF
语音端点检测的仿真研究 被引量:21
15
作者 刘晓明 覃胜 +1 位作者 刘宗行 江泽佳 《系统仿真学报》 EI CAS CSCD 北大核心 2005年第8期1974-1976,共3页
语音端点检测在语音处理中占有十分重要的地位。介绍了短时平均能量法、短时平均过零率法和短时能零积法三种语音端点检测法。在低信噪比环境下,利用上述方法进行语音端点检测,检测效果将大大降低。功率谱减法是一种传统的降噪方法。但... 语音端点检测在语音处理中占有十分重要的地位。介绍了短时平均能量法、短时平均过零率法和短时能零积法三种语音端点检测法。在低信噪比环境下,利用上述方法进行语音端点检测,检测效果将大大降低。功率谱减法是一种传统的降噪方法。但是功率谱减法采用固定的无音片段作为噪声样本容易引起误差。为此,笔者综合短时能零积法和功率谱减法,提出了加权功率谱减法,并用于语音端点检测。详细地给出了加权功率谱减法的实现步骤。实验结果表明该方法具有良好的性能。 展开更多
关键词 语音端点检测 短时能零积 闽值 加权功率谱减法
下载PDF
一个基于谱熵的语音端点检测改进方法 被引量:27
16
作者 王让定 柴佩琪 《信息与控制》 CSCD 北大核心 2004年第1期77-81,共5页
本文提出了基于谱熵和谱减法相结合的带噪语音端点检测改进算法以及端点检测的判决准则 .仿真实验表明 ,在语音信号受到强噪声的干扰后 (5dB≤SNR≤ 15dB) ,所提方法可检测到准确的语音端点 .
关键词 谱熵 谱减法 端点检测 判决准则 带噪语音 自动语音识别 语音编码
下载PDF
基于临界频带及能量熵的语音端点检测 被引量:9
17
作者 张婷 何凌 +1 位作者 黄华 刘肖珩 《计算机应用》 CSCD 北大核心 2013年第1期175-178,共4页
语音端点检测的准确性直接关系着语音识别、合成、增强等语音领域的准确性,为了提高语音端点检测的有效性,提出了一种基于临界频带及能量熵的语音端点检测算法。算法充分利用人耳听觉特性的频率分布,将含噪语音信号进行临界频带划分,并... 语音端点检测的准确性直接关系着语音识别、合成、增强等语音领域的准确性,为了提高语音端点检测的有效性,提出了一种基于临界频带及能量熵的语音端点检测算法。算法充分利用人耳听觉特性的频率分布,将含噪语音信号进行临界频带划分,并结合各频带内信号的能量熵值在语音段和噪声段的不同分布,实现不同背景噪声下语音端点检测。实验结果表明,提出的语音端点检测算法与传统的短时能量法相比,检测正确率平均高1.6个百分点。所提方法在不同噪声的低信噪比(SNR)环境下均能实现语音端点检测。 展开更多
关键词 小波降噪 临界频带 能量熵 语音端点检测
下载PDF
语音信号端点检测方法综述及展望 被引量:40
18
作者 刘华平 李昕 +1 位作者 徐柏龄 姜宁 《计算机应用研究》 CSCD 北大核心 2008年第8期2278-2283,共6页
端点检测是语音信号处理过程中非常重要的一步,它的准确性直接影响语音信号处理的速度和结果,因此端点检测方法的研究,特别是在噪声环境下端点检测的研究,一直是语音信号处理中的热点。从基于时域参数、频域参数、时频参数、模型匹配等... 端点检测是语音信号处理过程中非常重要的一步,它的准确性直接影响语音信号处理的速度和结果,因此端点检测方法的研究,特别是在噪声环境下端点检测的研究,一直是语音信号处理中的热点。从基于时域参数、频域参数、时频参数、模型匹配等方法的角度,较全面地回顾了端点检测方法的发展历程,对各种方法的优缺点进行了比较分析,并给出了这些方法的改进意见,对端点检测未来的研究方向进行了展望。 展开更多
关键词 语音信号处理 端点检测 鲁棒性
下载PDF
基于倒谱特征的带噪语音端点检测 被引量:70
19
作者 胡光锐 韦晓东 《电子学报》 EI CAS CSCD 北大核心 2000年第10期95-97,共3页
在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环... 在语音识别系统中产生错误识别的原因之一是端点检测有误差 .在高信噪比情况下 ,正确地确定语音的端点并不困难 .然而 ,大多数实际的语音识别系统需工作在低信噪比情况下 ,一些常规的端点检测方法 ,例如基于能量的端点检测方法在噪声环境下不能有效地工作 .本文利用倒谱特征来检测语音端点 ,提出了带噪语音端点检测的两个算法 ,第一个算法利用倒谱距离代替短时能量作为判决的门限 ,第二个算法改进了基于隐马尔柯夫模型 (HMM)的语音检测以适应噪声的变化 ,实验结果表明本方法可得到高正确率的带噪语音端点检测 . 展开更多
关键词 语音识别 端点检测 倒谱距离 语音信号处理
下载PDF
基于广义维数距离的语音端点检测方法 被引量:11
20
作者 武薇 范影乐 庞全 《电子与信息学报》 EI CSCD 北大核心 2007年第2期465-468,共4页
为能够准确有效地对含噪声语音信号进行起止位置的端点检测,该文提出了一种基于广义维数距离的端点检测方法。首先利用覆盖法求取广义维数得到该语音信号的三维特征向量,包括容量维数、信息维数、关联维数;然后计算信号的维数特征距离;... 为能够准确有效地对含噪声语音信号进行起止位置的端点检测,该文提出了一种基于广义维数距离的端点检测方法。首先利用覆盖法求取广义维数得到该语音信号的三维特征向量,包括容量维数、信息维数、关联维数;然后计算信号的维数特征距离;最后根据特征距离对语音信号类别进行决策分类。实验结果表明,与仅使用单一维数特征检测语音起止端点相比,该文所提出的方法具有较好的鲁棒性,对混杂有不同噪声、不同信噪比的语音信号都能有较好的检测结果,尤其适用于低信噪比的语音端点检测。 展开更多
关键词 语音端点检测 广义维数 特征距离
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部