期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
说话人识别中语音切分算法的研究 被引量:4
1
作者 何致远 胡起秀 徐光 《计算机工程与应用》 CSCD 北大核心 2003年第6期55-58,共4页
论文针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法犤1,3犦的基础上,提出了三种孤立词的精确切分算法和一种连续语音的非精确切分算法。实验表明,新算法较好地克服了语音能量变化对切分的影响,... 论文针对说话人识别中语音能量变化和噪声对提取有效语音数据的影响,在传统时域语音切分算法犤1,3犦的基础上,提出了三种孤立词的精确切分算法和一种连续语音的非精确切分算法。实验表明,新算法较好地克服了语音能量变化对切分的影响,在原始语音具有较高信噪比(≥10dB)的情况下,能够切除某些短时噪声和白噪声犤2犦。 展开更多
关键词 说话人识别 语音切分算法 语音识别 孤立词切分算法 帧参数规一化
下载PDF
基于贝叶斯方法的鲁棒语音切分 被引量:2
2
作者 张文军 谢剑英 李聪 《数据采集与处理》 CSCD 2002年第3期260-264,共5页
在基于隐马尔科夫模型的语音切分基础上 ,融合了不受噪声干扰的先验切分模型 ,提出了基于贝叶斯方法的语音切分方法。在贝叶斯切分方法的框架内 ,作者首先对语音序列进行了变换 ,将由切分点构成的序列变为由音节长度构成的序列。然后 ,... 在基于隐马尔科夫模型的语音切分基础上 ,融合了不受噪声干扰的先验切分模型 ,提出了基于贝叶斯方法的语音切分方法。在贝叶斯切分方法的框架内 ,作者首先对语音序列进行了变换 ,将由切分点构成的序列变为由音节长度构成的序列。然后 ,假设音节长度序列符合一阶马尔科夫过程 ,经过归一化处理后 ,求出了切分的先验概率公式 ,得到了贝叶斯方法的切分模型。在噪声环境下的实验证明 ,由于切分模型独立于噪声 ,对在噪声环境下声学模型的失配提供了很好的补偿 ,使得语音切分的鲁棒性大大增加。 展开更多
关键词 贝叶斯方法 鲁棒性 语音切分 切分模型 语音识别 语音合成 语音信号处理
下载PDF
基于主成分分析的汉语连续语音切分算法 被引量:3
3
作者 张永锋 杨影 肖莹莹 《应用声学》 CSCD 北大核心 2011年第5期366-369,共4页
连续语音切分是汉语连续语音识别中的一项重要技术。本文将通常用于图像处理的主成分分析(PCA)方法引入汉语连续语音切分领域,目的是通过PCA,降低语音帧之间的频谱相关性。再利用相邻语音帧特征构成的三维子空间的大小,实现连续语音切分... 连续语音切分是汉语连续语音识别中的一项重要技术。本文将通常用于图像处理的主成分分析(PCA)方法引入汉语连续语音切分领域,目的是通过PCA,降低语音帧之间的频谱相关性。再利用相邻语音帧特征构成的三维子空间的大小,实现连续语音切分,取得了不错的切分效果。 展开更多
关键词 主成分分析 连续语音切分
下载PDF
连续话语语料库的语音切分和标记 被引量:6
4
作者 陈肖霞 《语言文字应用》 CSSCI 北大核心 2000年第2期78-82,共5页
对连续话语语料库进行切分和标记是一项新的课题 ,它对语料库的充分利用有重要作用 ,如何做好这项工作是一个值得探讨的问题。本文通过对一个语料库的切分和标记 ,得出了一些初步看法和认识 ,在这里跟同行们切磋 ,以使这项工作做得更完善。
关键词 连续话语语料库 语音切分 标记形式 标记原则
下载PDF
对外汉语教学中兼语句的语音切分研究 被引量:2
5
作者 王丽香 姜海陵 《云南师范大学学报(对外汉语教学与研究版)》 2004年第4期35-39,共5页
本文通过对汉语特有句型兼语句的语音切分,找到该句型语音切分的某些规则,发现兼语句的语音切分大部分与语法切分不同,另外通过对兼语句的语音切分的研究,还发现影响语音切分的几个因素:语法规则、语义表达、节奏等.
关键词 对外汉语教学 兼语句 语音切分 语法规则 语义表达 节奏 停延规律
下载PDF
“有”字句的语音切分
6
作者 段晓平 王淑君 《浙江广播电视高等专科学校学报》 2002年第4期53-55,共3页
本文从语音停延的角度对狭义的“有”字句进行考察,分析了语音切分与语法切分相一致、不一致及两可三种情况。认为一般用语法结构关系来说明语音停延远远不够,“有”字句的语音停延主要受节律因素和语义表达的制约。
关键词 “有”字句 停延 语法结构 语音切分
下载PDF
一种人机交互语音切分系统 被引量:4
7
作者 郭琳 苏洁 +3 位作者 李余芳 刘敬凤 胡文君 潘文林 《云南民族大学学报(自然科学版)》 CAS 2016年第1期87-91,共5页
对于大规模的语音语料,语音切分方法主要有传统的人工切分和机器自动化切分2种方式.人工切分大规模语音语料的切分质量易控制,但效率低、成本高;机器自动化切分效率高,但后期查找切分错误时任务极其繁重.因而提出一种人机交互语音切分系... 对于大规模的语音语料,语音切分方法主要有传统的人工切分和机器自动化切分2种方式.人工切分大规模语音语料的切分质量易控制,但效率低、成本高;机器自动化切分效率高,但后期查找切分错误时任务极其繁重.因而提出一种人机交互语音切分系统,切分人员可选择自动切分算法,设置切分参数,修改有问题的自动切分结果,同时可自动生成用于HTK训练的标注文件.以课题组采集的1 000个普米语语音文件为研究对象,以普米语孤立词为切分基元,机器自动化切分存在难以避免的切分错误,后期检查时工作量巨大;然而使用本文提出的人机交互语言切分系统进行切分,切分人员在无需高认知度的情况下也可做到近100%的切分正确率. 展开更多
关键词 普米语音 语音切分 人机交互系统
下载PDF
一种改进的基于时域参数的语音切分算法 被引量:3
8
作者 林帆 徐明星 《计算机科学》 CSCD 北大核心 2006年第4期164-167,共4页
本文探讨了基于时域的语音切分算法,在前人研究的基础上,提出一种改进算法——自适应、前后搜索和检测短时脉冲噪音算法。该算法主要利用语音信号的短时参数,采用统计的方法定出切分所需要的阈值;根据背景音和静音过零率的不同,进一步... 本文探讨了基于时域的语音切分算法,在前人研究的基础上,提出一种改进算法——自适应、前后搜索和检测短时脉冲噪音算法。该算法主要利用语音信号的短时参数,采用统计的方法定出切分所需要的阈值;根据背景音和静音过零率的不同,进一步搜索符合要求的静音帧;同时滤去短时脉冲噪音。实验证明,该算法准确卑很高,有很好的鲁棒性,允许误差在60 ms 的范围内,对于原始语音切分错误率为5.04%;在信噪比(SNR)大于等于2 dB 的情况下,对带噪语音的切分错误率为10%~20%。 展开更多
关键词 语音切分 短时参数 自适应 前后搜索 检测短时脉冲噪首
下载PDF
一种改进的基于Viterbi的语音切分算法 被引量:4
9
作者 李欢欢 王金明 +3 位作者 尹海明 徐志军 孔磊 张开礼 《通信技术》 2015年第9期1027-1031,共5页
主要针对文本提示型说话人识别中语音切分高精确度要求的问题,在利用Viterbi算法的语音切分基础上,提出了向后平滑搜索多帧能量极小值的语音切分方法。该算法首先对0—9的每个数字建立模型,然后利用Viterbi算法对随机数字串进行切分... 主要针对文本提示型说话人识别中语音切分高精确度要求的问题,在利用Viterbi算法的语音切分基础上,提出了向后平滑搜索多帧能量极小值的语音切分方法。该算法首先对0—9的每个数字建立模型,然后利用Viterbi算法对随机数字串进行切分得到初始切分点,最后利用搜索多帧能量极小值的方法更新原始切分点。实验表明,相比于传统的切分算法,在误差范围小于20ms之内,改进算法的切分准确率由82.1%提高到88%。 展开更多
关键词 语音切分 VITERBI 多帧能量极小值
下载PDF
汉语连续语音切分技术研究
10
作者 王宇琛 张二华 《计算机与数字工程》 2020年第8期1864-1869,共6页
汉语连续语音切分的准确性,是影响汉语语音识别率的重要因素之一。连续语音切分是汉语语音识别的重要基础,论文介绍了汉语语音切分技术的基本原理,综合利用端点检测、基音周期轨迹、语谱图等特征,研究了一种汉语语音切分的算法。实验表... 汉语连续语音切分的准确性,是影响汉语语音识别率的重要因素之一。连续语音切分是汉语语音识别的重要基础,论文介绍了汉语语音切分技术的基本原理,综合利用端点检测、基音周期轨迹、语谱图等特征,研究了一种汉语语音切分的算法。实验表明该算法能有效提高汉语连续语音切分的准确率。 展开更多
关键词 语音切分 端点检测 语谱图
下载PDF
连续汉语语音的自动切分研究
11
作者 李琦 张二华 《计算机与数字工程》 2023年第4期959-964,共6页
连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱... 连续汉语语音的自动切分是语音识别的基础,准确的连续语音切分方法可以代替人工标记汉字音节。传统的连续汉语语音自动切分技术如双门限端点检测、基于倒谱的端点检测等方法的效果都难以满足语音识别的需要。论文在时间域、频域及倒谱域等多个层次对连续语音信号进行分析,结合端点检测技术、频谱分析和倒等方法对音节切分点进行检测,研究了一种连续语音多级切分方法。相比传统的基于双门限和倒谱的端点检测方法,该方法将单字切分的正确率达到了92.8%。 展开更多
关键词 语音切分 端点检测 语谱图 双门限法 频带能量
下载PDF
一种新的汉语连续语音统计切分算法 被引量:1
12
作者 顾明亮 代春倩 《徐州师范大学学报(自然科学版)》 CAS 2005年第4期45-49,共5页
在分析最小相位群延迟函数特点的基础上,提出了一种改进的汉语连续语音自动切分算法,该算法利用短时能量和类音节平均统计时长构造的最小相位群延迟函数为切分依据,将连续语音切分成一系列类音节单元.实验结果表明,本算法具有96·4... 在分析最小相位群延迟函数特点的基础上,提出了一种改进的汉语连续语音自动切分算法,该算法利用短时能量和类音节平均统计时长构造的最小相位群延迟函数为切分依据,将连续语音切分成一系列类音节单元.实验结果表明,本算法具有96·4%的切分正确率,比原算法提高5·2%. 展开更多
关键词 最小相位函数 统计平均时长 自动语音切分
下载PDF
基于听觉事件检测的汉语语音声韵切分 被引量:7
13
作者 张宝奇 张连海 屈丹 《声学学报》 EI CSCD 北大核心 2010年第6期701-707,共7页
提出了一种基于听觉事件检测的汉语声韵母切分方法。该方法首先使用耳蜗滤波器组对语音进行滤波,然后在每个频带上检测对应于能量突变的听觉事件,最后在不同频率范围对听觉事件进行融合以确定声韵母边界。实验结果表明,对8 kHz采样的干... 提出了一种基于听觉事件检测的汉语声韵母切分方法。该方法首先使用耳蜗滤波器组对语音进行滤波,然后在每个频带上检测对应于能量突变的听觉事件,最后在不同频率范围对听觉事件进行融合以确定声韵母边界。实验结果表明,对8 kHz采样的干净语音切分准确率可达到88.9%;信噪比10 dB的语音切分准确率可达到82.9%以上。 展开更多
关键词 事件检测 声韵切分 汉语语音 听觉 语音切分 频率范围 滤波器 准确率
下载PDF
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究 被引量:1
14
作者 吕国云 蒋冬梅 +2 位作者 张艳宁 赵荣椿 Hichem Sahli 《西北工业大学学报》 EI CAS CSCD 北大核心 2008年第2期173-178,共6页
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Net... 提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network,Phone-shared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接。它的识别基元为音素,描述了音素的动态发音变化过程。大词汇量语音识别的实验结果表明:在纯净语音环境下,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而音频流的音素切分正确率则分别提高了10%和44%。 展开更多
关键词 动态贝叶斯网络 音视频语音识别音素切分
下载PDF
基于小波子带分解的特征参数对语音自动切分的改进 被引量:2
15
作者 秦欢 柴佩琪 陈锴 《计算机应用》 CSCD 北大核心 2005年第6期1345-1346,共2页
采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切... 采用了基于小波子带分解的特征提取方法,根据DCT和DWT两种去相关方法的不同,得到语音信号的特征参数分别为SubbandBasedCepstral(SBC)和WaveletPacketParameters(WPP)。实验切分结果表明,基于小波子带分解的特征参数比MFCC取得更好的切分效果。 展开更多
关键词 隐马尔可夫模型 语音自动切分 MEL频率倒谱系数 小波子带分解
下载PDF
基于HMM的中文语音自动切分中的静音添加 被引量:1
16
作者 陈锴 柴佩琪 《计算机工程》 CAS CSCD 北大核心 2004年第9期40-41,共2页
在建立语音语料库的过程中经常会碰到语音中加了很多对应文本所没有的静音标记,这些静音的存在直接影响到实际的切分结果。该文提出了一种静音自动添加的方法。在经过粗切分后,通过规则设定,短时能量、短时过零率和算法修正几个步骤... 在建立语音语料库的过程中经常会碰到语音中加了很多对应文本所没有的静音标记,这些静音的存在直接影响到实际的切分结果。该文提出了一种静音自动添加的方法。在经过粗切分后,通过规则设定,短时能量、短时过零率和算法修正几个步骤,将静音寻找出来,添加到对应文本之中。该方法已运用到实际切分中,准确率在95%以上,取得了较好的效果。 展开更多
关键词 语音自动切分 隐马尔可夫模型 HMM 中文语言处理 静音添加
下载PDF
基于HMM连接语音自动切分中的初始化模型研究 被引量:1
17
作者 祝瑶卿 柴佩琪 《微型电脑应用》 2003年第7期12-14,共3页
本文讨论了基于 HMM算法对连续语料进行自动切分时模型初始化训练的有种子和无种子两种方法。用相同语料 ,在 HMM模型结构及定义完全相同的情况下 ,比较了用种子方法 (带时间标记 lab文件 )来初始化 HMM模型 ,以及用无种方法 (直接用所... 本文讨论了基于 HMM算法对连续语料进行自动切分时模型初始化训练的有种子和无种子两种方法。用相同语料 ,在 HMM模型结构及定义完全相同的情况下 ,比较了用种子方法 (带时间标记 lab文件 )来初始化 HMM模型 ,以及用无种方法 (直接用所需切分的语料和不带时间标记的 lab文件 )进行 HMM模型初始训练的优缺点。文章最后通过比较波形和整理数据 ,得到结论 :有种子方法初始化 HMM模型对连续语料切分 ,尤其在元音上 。 展开更多
关键词 语音识别 语音合成 HMM算法 连接语音自动切分 初始化模型
下载PDF
维吾尔语语音数据库的手工标注及软件实现 被引量:3
18
作者 王昆仑 张晓强 王光照 《新疆师范大学学报(自然科学版)》 2001年第3期25-33,共9页
附加标注信息的语音数据库在语音识别研究中的作用十分重要。本文介绍了我们开发的维吾尔语语音数据库手工标注系统的功能及其在实现过程中采用的一些技术 。
关键词 维吾尔语 语音数据库 语音标注 语音识别 手工标注系统 语音切分原理
下载PDF
基于CGRU多输入特征的地空通话自动切分 被引量:4
19
作者 郭东岳 林毅 杨波 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第5期887-893,共7页
自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影... 自动语音切分是语音识别、声纹识别、语音降噪等语音应用中非常重要的预处理环节,切分算法的优劣直接影响了系统输出结果的精度.在空管地空通话中,传输信道噪声、天气因素以及说话人工作状态均会对语音信号产生影响,进而在一定程度上影响语音切分性能.在分析空管地空通话语音特性基础上,提出了一种基于CGRU网络多输入特征的自动语音切分方法.该方法结合地空通话的特点,采用深度学习的方法进一步提取语音信号的时域和频域非线性特征,将语音信号帧分类为语音帧、结束帧以及其他帧三类.实验对比了多种语音特征作为输入对切分效果的影响,同时验证了GMM、CNN、CLDNN、CGRU等切分算法在真实地空通话测试集上的表现,并提出了一种简单预测结果平滑算法.实验结果表明,文中提出的自动切分方法在地空通话中具有明显优势,分类模型的AUC值达到了0.98. 展开更多
关键词 语音切分 语音端点检测 地空通话 卷积神经网络 循环神经网络
下载PDF
基于语音识别的朝鲜语语音检索方法
20
作者 徐博文 金小峰 《延边大学学报(自然科学版)》 CAS 2021年第3期273-278,共6页
针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型;其次通过语音文档分割方法构建了语音文档... 针对基于语音识别的语音检索方法对语言模型的强依赖问题,通过改进声学模型学习框架提出了一种新的朝鲜语语音检索方法.该方法首先修改KoSpeech框架的网络模型,通过训练得到了朝鲜语的声学模型;其次通过语音文档分割方法构建了语音文档索引库;最后利用编辑距离匹配的方法实现了语音检索.实验结果表明,改进的朝鲜语声学模型学习框架降低了语音检索方法对语言模型的依赖和大规模数据集的要求.当k取9时,top-k评价方法的检索均值平均精度达到86.74%,召回率达到95.25%,该结果表明本文提出的方法是有效的,具有一定的实际应用价值. 展开更多
关键词 语音检索 语音识别 声学模型 语音切分
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部