期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
基于卷积神经网络的实时语音分割优化研究
1
作者 杨波 《电声技术》 2024年第5期46-48,共3页
为进一步提高实时语音分割的性能,分析基于卷积神经网络(Convolutional Neural Networks,CNN)的实时语音分割优化方法。首先,介绍CNN的基本结构和在语音分割中的数学原理。其次,引入修剪技术,根据权重的重要性分数决定保留或删除权重。... 为进一步提高实时语音分割的性能,分析基于卷积神经网络(Convolutional Neural Networks,CNN)的实时语音分割优化方法。首先,介绍CNN的基本结构和在语音分割中的数学原理。其次,引入修剪技术,根据权重的重要性分数决定保留或删除权重。实验结果表明,该方法的准确率、召回率、F1值及用时均优于传统CNN。 展开更多
关键词 卷积神经网络(CNN) 语音分割 实时性 修剪技术
下载PDF
一种改进的基于说话者的语音分割算法 被引量:17
2
作者 卢坚 毛兵 +1 位作者 孙正兴 张福炎 《软件学报》 EI CSCD 北大核心 2002年第2期274-279,共6页
: 语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的... : 语音分割是语音识别和语音文档检索等众多语音应用的基础.提出一种改进的基于说话者的语音分割算法,对GLR和BIC相结合的算法作进一步的改进:(1) 基于GLR距离方差的自适应阈值调整算法改进了不同声学特征下基于距离的语音分割算法中的阈值选取方法;(2) 引入BIC可测度概念来度量其适用范围;(3) BIC信息准则校准非冗余的候选分割点的偏差.实验结果表明,此改进算法优于原算法. 展开更多
关键词 贝叶斯信息准则 语音分割算法 说话者 语音识别
下载PDF
基于小波变换的静音与语音分割新算法 被引量:12
3
作者 梅晓丹 孙圣和 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2002年第3期408-411,共4页
含噪语音信号的静音与语音分割 ,即端点检测问题是语音识别至关重要的一步 .为了提高语音分割对环境的适应性 ,提出了一种利用小波变换分割含噪语音信号中静音与语音的新算法 .该算法首先将语音信号进行小波变换 ,利用小波系数去噪 ,然... 含噪语音信号的静音与语音分割 ,即端点检测问题是语音识别至关重要的一步 .为了提高语音分割对环境的适应性 ,提出了一种利用小波变换分割含噪语音信号中静音与语音的新算法 .该算法首先将语音信号进行小波变换 ,利用小波系数去噪 ,然后选择小波部分子带跟踪信号的能量变化以分割语音与静音 . 展开更多
关键词 静音 算法 语音分割 小波变换 含噪语音 语音信号处理 语音识别
下载PDF
MP3压缩域中语音分割的研究与实现 被引量:3
4
作者 常辽豫 余小清 +2 位作者 万旺根 李昌莲 许雪琼 《计算机应用》 CSCD 北大核心 2009年第4期1188-1192,共5页
针对说话人改变点检测问题,在MP3格式下用改进型B IC算法实现了多话者改变点的检测。根据非压缩域中MFCC的求取过程,提出了一种在压缩域MP3格式下利用MDCT系数计算MFCC特征参数的新方法。在此基础上,使用改进型B IC改变点检测算法检测... 针对说话人改变点检测问题,在MP3格式下用改进型B IC算法实现了多话者改变点的检测。根据非压缩域中MFCC的求取过程,提出了一种在压缩域MP3格式下利用MDCT系数计算MFCC特征参数的新方法。在此基础上,使用改进型B IC改变点检测算法检测说话人改变点。实验表明在相同的B IC检测算法下,利用在压缩域中提取的MFCC特征参数进行语音分割,可以得到和非压缩域相似的分割精确度。 展开更多
关键词 压缩域 BIC检测 语音分割 MDCT系数
下载PDF
基于分形维数实现语音分割和增强 被引量:8
5
作者 陈亮 张雄伟 《北京邮电大学学报》 EI CAS CSCD 北大核心 2003年第z1期112-114,125,共4页
在研究语音分形维数基础上,提出语音音素分割和模糊控制语音增强的新方法。
关键词 混沌 分形维数 语音分割 语音增强
下载PDF
多重分形维数在语音分割和语音识别中的应用 被引量:4
6
作者 董远 胡光锐 《上海交通大学学报》 EI CAS CSCD 北大核心 1999年第11期1406-1408,共3页
语音气流中具有混沌特征,而分形可以定量地分析混沌现象,故分形可作为分析语音信号的数学工具.由于传统的Hausdorff-Besicovitch 维数没有考虑关于集合中点的分布信息,本文引入多重分形维数来克服上述缺点.... 语音气流中具有混沌特征,而分形可以定量地分析混沌现象,故分形可作为分析语音信号的数学工具.由于传统的Hausdorff-Besicovitch 维数没有考虑关于集合中点的分布信息,本文引入多重分形维数来克服上述缺点.实验表明,多重分形维数语音分割方法明显好于单一Hausdorff-Besicovitch 展开更多
关键词 分形 多重分形 语音分割 语音识别 维数
下载PDF
一种基于分形理论的语音分割新方法 被引量:2
7
作者 董远 胡光锐 孙放 《上海交通大学学报》 EI CAS CSCD 北大核心 1998年第4期97-99,共3页
语音是由混沌的自然音素组成的,而分形可以很好地为成混沌状态的自然音素建模.语音波形具有分形特征,将分形用于改善语音识别技术越来越受到重视.语音的特性决定了每一个音素展现其固有模式,因此相邻音素之间的分维值不同.通常求... 语音是由混沌的自然音素组成的,而分形可以很好地为成混沌状态的自然音素建模.语音波形具有分形特征,将分形用于改善语音识别技术越来越受到重视.语音的特性决定了每一个音素展现其固有模式,因此相邻音素之间的分维值不同.通常求取语音波形的分维值轨迹可把人的发音分割成句子、词、甚至音素.实验证明,该方法在语音分割中取得了很好的效果. 展开更多
关键词 语音识别 语音分割 分形维数
下载PDF
利用投票选择机制进行语音分割的新方法 被引量:2
8
作者 黄湘松 赵春晖 陈立伟 《计算机工程与应用》 CSCD 北大核心 2009年第24期21-24,共4页
针对在噪声背景下连续语音信号的语音分割性能会明显下降的问题,提出了一种针对连续语音信号分割的新方法。该方法不再采用单一的端点检测方法,而是将基于分形维数的端点检测方法,基于倒谱特征的端点检测方法,基于HMM的端点检测方法等... 针对在噪声背景下连续语音信号的语音分割性能会明显下降的问题,提出了一种针对连续语音信号分割的新方法。该方法不再采用单一的端点检测方法,而是将基于分形维数的端点检测方法,基于倒谱特征的端点检测方法,基于HMM的端点检测方法等多种不同方法下得到的端点检测结果,通过投票选择的方式,得到最终的端点检测结果,从而达到对连续语音信号进行分割的目的。实验结果表明,该方法较明显地提高了语音分割的准确性。 展开更多
关键词 语音分割 倒谱特征 分形维数 隐马尔科夫模型(HMM) 投票选择 背景噪声
下载PDF
一种基于说话者的无监督语音分割算法 被引量:3
9
作者 高福友 陈雁翔 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第5期683-686,708,共5页
手机对话语音中2个说话者之间存在着信道和声学特征上的差异,利用这种差异可以从对话语音中分出属于每个话者的语音部分。文章重点讨论了一种基于距离的无监督语音分割算法,并比较了欧氏距离及广义似然比和持续时间相结合的2种距离测度... 手机对话语音中2个说话者之间存在着信道和声学特征上的差异,利用这种差异可以从对话语音中分出属于每个话者的语音部分。文章重点讨论了一种基于距离的无监督语音分割算法,并比较了欧氏距离及广义似然比和持续时间相结合的2种距离测度,后者利用假设检验的似然比来描述2个语音段之间的相似性,通过与文本无关的手机对话语音的话者确认系统实验,表明了它比前者更优越,能较好地检测出绝大部分的说话者改变点,且计算代价也较低。 展开更多
关键词 手机对话语音 GLR距离测度 无监督语音分割
下载PDF
基于二级搜索模型的有声出版物语音分割算法
10
作者 张俊星 刘宇 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2009年第S2期376-380,共5页
提出了一种二级搜索模型,该模型首先利用最小音节步长搜索算法进行语音段检测,然后采用二分搜索算法确定语音段的精确位置。理论分析及实际运行结果表明,与传统的基于能量的端点检测算法相比,其搜索效率能够提高70%以上。该算法对语音... 提出了一种二级搜索模型,该模型首先利用最小音节步长搜索算法进行语音段检测,然后采用二分搜索算法确定语音段的精确位置。理论分析及实际运行结果表明,与传统的基于能量的端点检测算法相比,其搜索效率能够提高70%以上。该算法对语音环境有较高的要求,可用于有声出版物语音自动分割,以及具有良好信噪比系统的语音端点检测。 展开更多
关键词 信息处理技术 语音分割 基于音节的搜索算法 二分搜索算法 有声出版物
下载PDF
一种基于上升缘与下降缘的语音分割方法
11
作者 郑荔平 《计算机工程与应用》 CSCD 2012年第5期127-130,共4页
听觉场景分析(Auditory Scene Analysis,ASA)系统能将一个场景分解为与不同声源对应的语音流。分割是ASA的主要步骤,借助分割可将一个听觉场景分解成多个片断。实现基于上升缘和下降缘分析的语音分割系统需检测上升缘与下降缘,通过匹配... 听觉场景分析(Auditory Scene Analysis,ASA)系统能将一个场景分解为与不同声源对应的语音流。分割是ASA的主要步骤,借助分割可将一个听觉场景分解成多个片断。实现基于上升缘和下降缘分析的语音分割系统需检测上升缘与下降缘,通过匹配对应的上升缘与下降缘的波前来生成语音片断,将这些片断重构成语音流。 展开更多
关键词 语音分割 事件检测 多尺度分析 上升缘 下降缘 计算听觉场景分析
下载PDF
基于改进特征值的语音分割算法研究 被引量:1
12
作者 任新社 缪华 马青玉 《南京师范大学学报(工程技术版)》 CAS 2011年第3期73-77,共5页
随着网络技术和媒体应用的迅速发展,传统的文本检索已不能满足需要,视频检索由于数据量大而得不到应用,语音检索就显示出重要的研究价值.一个语音序列由多种不同类型的语音片段构成,而每一种类型的语音往往又包含不同的意义,因此通过语... 随着网络技术和媒体应用的迅速发展,传统的文本检索已不能满足需要,视频检索由于数据量大而得不到应用,语音检索就显示出重要的研究价值.一个语音序列由多种不同类型的语音片段构成,而每一种类型的语音往往又包含不同的意义,因此通过语音特征进行语音分段来实现语音检索是现代媒体数据进行检索的重要手段.通过对语音信号每一帧的基本特征值与整个语音序列的平均基本特征值进行比较,得到一个改进的特征值,并利用K-Nearest Neighbor算法进行语音分割,结果表明基于改进特征值的语音分割算法能够有效提高语音分割的准确性. 展开更多
关键词 语音检索 语音分割 改进特征值
下载PDF
快速HAC聚类算法的改进及应用于无监督语音分割 被引量:1
13
作者 韦占江 梁宇 《计算机科学与应用》 2020年第8期1464-1470,共7页
HAC是一种常用的聚类方法。本文的目的是根据语音特征中的音素与连续时间的紧密关系,改进HAC快速算法提高无监督分割语音信号到类似音素单位。该算法是基于同一段特征相似度高于跨段特征的相似度。特征的相似度是通过计算相邻特征间的... HAC是一种常用的聚类方法。本文的目的是根据语音特征中的音素与连续时间的紧密关系,改进HAC快速算法提高无监督分割语音信号到类似音素单位。该算法是基于同一段特征相似度高于跨段特征的相似度。特征的相似度是通过计算相邻特征间的欧式距离,来得到输入语音特征相邻的距离双链表,链表中的每个节点由语音相邻特征的距离和指向前后相邻节点的指针组成。该算法也是通过遍历相邻距离节点链表,查找最小距离后,对相似的相邻特征进行合并,并重复迭代至最后一个类或满足某个阀值。整个过程完全基于无监督下完成,该方法优于快速HAC算法,与快速HAC算法相比能提升65倍以上的聚类速度,节约更多的内存空间,可应用于零资源的语音分割。 展开更多
关键词 无监督 音素 HAC算法 语音分割 相邻
下载PDF
语音分割与端点检测研究综述 被引量:9
14
作者 杨健 李振鹏 苏鹏 《计算机应用》 CSCD 北大核心 2020年第1期1-7,共7页
语音分割是语音识别和语音合成中必不可少的基础性工作,其质量对后续系统的影响巨大。使用手工分割和标注虽然精度高,但费时费力,同时需要熟练的领域专家来完成,自动语音分割因此成为语音处理的研究热点。首先针对自动语音分割目前的研... 语音分割是语音识别和语音合成中必不可少的基础性工作,其质量对后续系统的影响巨大。使用手工分割和标注虽然精度高,但费时费力,同时需要熟练的领域专家来完成,自动语音分割因此成为语音处理的研究热点。首先针对自动语音分割目前的研究进展,介绍了语音分割的不同分类方法;然后分别介绍了基于对齐的方法和基于边界检测的方法,并详细介绍了可以应用在上述两种框架下的神经网络语音分割方法;接着介绍了基于生物激励信号以及博弈论等方法的新型语音分割技术,并给出了领域内广泛使用的性能评估度量,并对这些评估指标进行比较和分析;最后总结并提出语音分割研究未来发展的重要方向。 展开更多
关键词 语音分割 端点检测 语音合成 信号特征 人工神经网络
下载PDF
基于快速样本熵计算的清浊音判决与语音分割
15
作者 孙桂琪 庄晓东 范珍艳 《青岛大学学报(工程技术版)》 CAS 2018年第4期98-103,共6页
为了对语音帧的清浊音属性进行判断,本文提出了一种基于快速样本熵的清浊音判决和语音分割方法。通过计算英语单音素发音的样本熵,可以发现清浊音的信号复杂度有明显的区别,并根据复杂度的不同来进行清浊音的判决。同时,在快速算法中将... 为了对语音帧的清浊音属性进行判断,本文提出了一种基于快速样本熵的清浊音判决和语音分割方法。通过计算英语单音素发音的样本熵,可以发现清浊音的信号复杂度有明显的区别,并根据复杂度的不同来进行清浊音的判决。同时,在快速算法中将数值二值化,由低维信号矢量的近邻矩阵递推高维信号矢量的近邻矩阵,可以快速有效的进行语音分割,并进行仿真实验。仿真结果表明,与其他传统方法相比,基于样本熵的方法可以得到较好的语音分割结果,而且快速样本熵算法将运算时间缩短了80倍,明显减少了运算时间,提高了运算效率。该研究在语音信号方面具有较好的应用前景。 展开更多
关键词 样本熵 快速样本熵 清浊音判决 语音分割
下载PDF
基于Python的BIC语音分割算法的实现与应用 被引量:3
16
作者 王方丽 傅嘉俊 《计算机与数字工程》 2020年第4期763-766,913,共5页
首先分析了基于贝叶斯信息准则的语音分割原理和算法设计,接着研究了语音多点分割的原理和算法,最后分析了运用语音活性检测对于分割点进行筛选的原理和方法。语音分割算法主要采用Python技术实现,同时,还将该语音分割算法应用到具体实... 首先分析了基于贝叶斯信息准则的语音分割原理和算法设计,接着研究了语音多点分割的原理和算法,最后分析了运用语音活性检测对于分割点进行筛选的原理和方法。语音分割算法主要采用Python技术实现,同时,还将该语音分割算法应用到具体实践中,解决视频资源语音翻译过程中语音的分割,以及加载翻译后字幕的显示时间长度的确定。最后,还对于该语音分割算法的功能进行了实验测试。 展开更多
关键词 语音信号处理 语音分割 贝叶斯信息准则 语音活性检测
下载PDF
基于混合特征的说话人语音分割聚类研究 被引量:3
17
作者 刘景天 姜囡 《光电技术应用》 2019年第5期37-41,共5页
研究众多说话人语音中提取目标说话人语音的问题。为提高多说话人语音分割聚类的准确性,结合MFCC特征高准确性和GFCC特征强鲁棒性的特点,提出一种基于MFCC与GFCC混合特征的语音分割聚类算法,有效避免了含噪语音分割聚类鲁棒性较差等问... 研究众多说话人语音中提取目标说话人语音的问题。为提高多说话人语音分割聚类的准确性,结合MFCC特征高准确性和GFCC特征强鲁棒性的特点,提出一种基于MFCC与GFCC混合特征的语音分割聚类算法,有效避免了含噪语音分割聚类鲁棒性较差等问题。针对叠加粉红噪声和工厂噪声的实验语音,分别基于常规算法和改进的分割聚类算法进行对比分析,结果表明,所提出的基于混合特征的语音分割聚类算法提取目标人语音的准确性更具优势。 展开更多
关键词 语音分割聚类 梅尔频率倒谱系数 伽马通滤波器倒谱系数 鲁棒性
下载PDF
典型多说话人语音自动分割算法研究
18
作者 陆思宇 姜囡 《警察技术》 2024年第2期35-38,共4页
针对多说话人涉案语音的检验处理,常需要人工将多说话人语音分为若干个单一说话人语音片段,逐一在长时语音段中寻找语音分割点,从而严重影响检验人员的工作效率。利用说话人语音分割技术可以自动高效寻找出语音段中目标说话人语音转换点... 针对多说话人涉案语音的检验处理,常需要人工将多说话人语音分为若干个单一说话人语音片段,逐一在长时语音段中寻找语音分割点,从而严重影响检验人员的工作效率。利用说话人语音分割技术可以自动高效寻找出语音段中目标说话人语音转换点,有效提升办案时效。分别选取BIC分割算法、基于Ecapa-tdnn声纹模型的左右窗分割算法、基于Bi-lstm的二分类窗分割算法以及固定窗分割算法,针对不同种类噪声的含噪语音进行语音自动分割的差异性分析。结果表明,左右窗和二分类窗分割算法具有良好的分割准确性和抗噪性,BIC和固定窗的非监督式分割算法在处理速度上具有明显优势。本文的分析结果可为多说话人涉案语音预处理方法选择上提供有效的数据和理论依据。 展开更多
关键词 说话人语音分割 语音预处理 低信噪比 贝叶斯准则 声纹模型
下载PDF
苗语语音音节自适应切分算法
19
作者 冯夫健 吴磊 +3 位作者 谭棉 蔡姗 张学文 王林 《科学技术与工程》 北大核心 2024年第14期5863-5871,共9页
语音分割是苗语语音基础研究的难点和热点问题,其本质是苗语语音音节与沉默段(静音、噪音)之间边界模糊问题,目前相关研究成果较少。针对苗语语音音节分割边界模糊问题,以时域特征分割获得初始的语音边界,通过构建语音音节边界优化评价... 语音分割是苗语语音基础研究的难点和热点问题,其本质是苗语语音音节与沉默段(静音、噪音)之间边界模糊问题,目前相关研究成果较少。针对苗语语音音节分割边界模糊问题,以时域特征分割获得初始的语音边界,通过构建语音音节边界优化评价函数模型,将音节与沉默段之间边界模糊问题转化为音节真实边界和算法预测边界的误差极小化问题,以精英策略保留算法最佳优化分割边界种群个体,提取苗语语音音节与沉默段间的精准边界。实验结果表明,所提方法能显著提高苗语语音音节自适应边界搜索能力。此外,所提自适应分割算法在语音分割模糊边界分割方面显著优于典型的语音分割算法。 展开更多
关键词 苗语语音分割 时域特征 苗语语音音节 精英策略 自适应
下载PDF
基于谱熵法的低信噪比案件语音分割聚类研究
20
作者 陆思宇 姜囡 《广东公安科技》 2023年第3期23-27,共5页
针对常规分割聚类方法在低信噪比语音条件下的局限性,为提高语音分割聚类的准确率,基于谱熵法提出结合贝叶斯信息准则(BIC)和模糊C均值聚类的分割聚类方法,同时在预处理环节引入语音端点检测,可有效降低噪声的影响。通过对谱聚类、双门... 针对常规分割聚类方法在低信噪比语音条件下的局限性,为提高语音分割聚类的准确率,基于谱熵法提出结合贝叶斯信息准则(BIC)和模糊C均值聚类的分割聚类方法,同时在预处理环节引入语音端点检测,可有效降低噪声的影响。通过对谱聚类、双门限和SOM-K-means等算法叠加不同种类噪声的分割聚类差异性分析,针对不同数目的说话人语音,在低信噪比条件下所提出的基于谱熵法的BIC模糊C分割聚类算法可有效提高语音分割聚类的准确性,在为后续案件语音识别和说话人识别准确率提升方面具有优越性。 展开更多
关键词 语音分割聚类 谱熵法 低信噪比 模糊C均值聚类
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部