期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
用于实时语声识别的连续VQ聚算法 被引量:3
1
作者 陈锡先 蔡长年 郭鹏 《电子学报》 EI CAS CSCD 北大核心 1990年第1期1-8,共8页
本文阐述了一个用于实时语声处理的连续矢量量化聚算法(CVQC)。该算法把语声信息的时变性质用于训练和识别过程。与通常的动态时间弯曲(DTW)和矢量量化VQ方法比较,这个新算法的训练和识别速度均较快,码本较小,但仍保留两种方法的优点。... 本文阐述了一个用于实时语声处理的连续矢量量化聚算法(CVQC)。该算法把语声信息的时变性质用于训练和识别过程。与通常的动态时间弯曲(DTW)和矢量量化VQ方法比较,这个新算法的训练和识别速度均较快,码本较小,但仍保留两种方法的优点。这个新开发的算法着重于实时实现。此外,本文还介绍了一个以CVQC为基础的语声控制计算机命令输入系统。 展开更多
关键词 语声识别 连续VQ聚算法 通信
下载PDF
隐马尔柯夫模型语声识别参数估计的研究
2
作者 陈锡先 王立健 《北京邮电学院学报》 CSCD 1989年第3期44-53,共10页
本文讨论了两种新的隐 Markov 模型(HMM)参数估计的方法,分别称为最大互信息估计(MMIE)和最大检测函数估计(MDE),并提出了一种改进的 HMM参数估计算法.
关键词 语声识别 马尔柯夫模型 参数估计
下载PDF
语声识别技术
3
作者 李昌竹 《电信科学》 北大核心 1994年第11期60-63,共4页
语声识别技术李昌竹(北京邮电大学北京100088)1前言语声识别(SpeechRecognition)是指采用计算机及电子电路自动提取语声信号中最基本、最有意义的信息,即韵质信息。人与人之间最顺畅的交流方式就是说话,... 语声识别技术李昌竹(北京邮电大学北京100088)1前言语声识别(SpeechRecognition)是指采用计算机及电子电路自动提取语声信号中最基本、最有意义的信息,即韵质信息。人与人之间最顺畅的交流方式就是说话,若人与机器也能直接通过说话进行交流... 展开更多
关键词 语声识别 模式匹配 语声特征
下载PDF
一个最小语声识别系统的构成及相关技术
4
作者 杨立东 《数据通信》 1995年第1期62-66,共5页
本文简述了一个用DSP芯片实现的语声识别系统,并对其最基本的技术问题进行了讨论。
关键词 语声识别 音调提取 语声端点检测 语谱图
下载PDF
多层感知器神经网络及其在语声识别方面的应用
5
作者 祝捷 《航空计算技术》 1992年第1期24-30,共7页
本文首先描述一种神经网络的拓扑结构——多层感知器神经网.其次推导出针对该神经网的整体学习算法,给出算法在一般微机上运行时所遇到的一些具体问题处理原则.最后将双隐层感知器用于语声识别.实验表明:多层感知器神经网络技术用于小... 本文首先描述一种神经网络的拓扑结构——多层感知器神经网.其次推导出针对该神经网的整体学习算法,给出算法在一般微机上运行时所遇到的一些具体问题处理原则.最后将双隐层感知器用于语声识别.实验表明:多层感知器神经网络技术用于小词汇量、低信噪比、机载条件语声识别系统,是一种有益的尝试. 展开更多
关键词 多层感知器 神经网络 语声识别
全文增补中
基于STA-CRNN模型的语声情感识别
6
作者 张志浩 王坤侠 《应用声学》 CSCD 北大核心 2022年第5期843-850,共8页
语声情感识别对人机交互和情感计算研究领域具有重要作用,各类研究方法层出不穷。近期研究学者应用卷积神经网络和长短期记忆网络方法提取对数Mel谱图空间特征和时间特征,取得了一定的成果。然而不论是卷积神经网络还是长短期记忆网络... 语声情感识别对人机交互和情感计算研究领域具有重要作用,各类研究方法层出不穷。近期研究学者应用卷积神经网络和长短期记忆网络方法提取对数Mel谱图空间特征和时间特征,取得了一定的成果。然而不论是卷积神经网络还是长短期记忆网络提取特征时,都会产生特征冗余,导致语声情感识别效果下降。针对这一问题,该文提出了一种基于时空注意力机制的卷积-递归神经网络模型,采用对数Mel谱图和其一阶差分、二阶差分作为特征输入,在使用卷积神经网络提取空间特征和长短期记忆网络提取时间特征时,加入空间注意力和时间注意力机制,从而使上述网络能够更好地提取到对数Mel谱图中有效表征情感的空间特征和时间特征。该模型在Emo-DB和IEMOCAP语声数据集上的加权准确率分别达到86.8%、69.4%,未加权准确率分别达到84.7%、65.5%,优于当前大多数先进方法。 展开更多
关键词 语声情感识别 对数Mel频谱图 时空注意力 时间特征 空间特征
下载PDF
几种音乐识别算法比较 被引量:10
7
作者 顾亦然 秦军 +1 位作者 王锁萍 杨灵 《南京邮电学院学报》 1998年第2期36-40,共5页
讨论了音乐识别领域中音高的三种不同的识别方法,即时域的并行处理法、频域的谐波峰值法以及时频域的小波算法。通过实例和分析,比较了各种方法的优缺点。
关键词 语声识别 音乐识别 并行处理 谐波峰值法
下载PDF
计算机语音信号处理与语音识别系统 被引量:10
8
作者 朱学芳 徐建平 《南京邮电学院学报》 1998年第5期113-119,共7页
对计算机语音处理和对单个数码字识别的实现进行了探讨。根据汉语语音的特点,以汉语单音字作为识别对象,对10个数码字识别进行了研究和实验。通过观察和分析语音信号的时域特性(主要是短时帧能量、短时过零率和帧能量差),并把它... 对计算机语音处理和对单个数码字识别的实现进行了探讨。根据汉语语音的特点,以汉语单音字作为识别对象,对10个数码字识别进行了研究和实验。通过观察和分析语音信号的时域特性(主要是短时帧能量、短时过零率和帧能量差),并把它们应用于语音端点检测,为系统的建立做了基础准备。选用了语音信号的功率谱差的特征,进行了模板的建立与识别实验。测试结果表明,该系统性能较稳定,单个数码字识别率可达986%,说话人识别率达到922%。 展开更多
关键词 语声处理 语声识别 WAVE文件格式 临界频带
下载PDF
语音识别中的抗噪声方法
9
作者 崔屹 张东 +1 位作者 时良平 陈丽媛 《北京邮电大学学报》 EI CAS CSCD 北大核心 1998年第2期10-14,共5页
在实验室环境中正确识别率很高的语音识别系统,在生产现场中的性能往往会大幅度下降,严重限制了语音识别技术的实际应用.针对邮政分拣中心的实际生产环境,对语音识别技术中的抗噪声问题进行了实验分析和研究,提出了几种在生产现场... 在实验室环境中正确识别率很高的语音识别系统,在生产现场中的性能往往会大幅度下降,严重限制了语音识别技术的实际应用.针对邮政分拣中心的实际生产环境,对语音识别技术中的抗噪声问题进行了实验分析和研究,提出了几种在生产现场中具有较好效果的噪声补偿方法。 展开更多
关键词 语声识别 语声信号处理 抗噪声方法
下载PDF
多讲话者汉语单字识别
10
作者 陈锡先 王立健 《北京邮电学院学报》 CSCD 1989年第2期1-7,共7页
本文详细介绍了隐 Markov 模型(HMM)的基本概念和计算概率的前、后向算法,并采用 HMM 作了多讲话者(三人)小词汇量汉语单字识别实验。正确识别率为98%。
关键词 隐MARKOV模型 语声识别 汉语 HMM
全文增补中
人耳听觉感知知识用于孤立数字语音识别
11
作者 张春涛 吴善培 《北京邮电大学学报》 EI CAS CSCD 北大核心 1997年第3期76-80,共5页
将人耳听觉感知方面的知识用于孤立数字语音识别,提取出感知线性预测倒谱参数(PLPC).对PLPC参数和线性预测倒谱参数(LPCC)进行比较,得出使用8阶PLPC参数可以获得优于12阶LPCC参数的性能.采用基于PLP... 将人耳听觉感知方面的知识用于孤立数字语音识别,提取出感知线性预测倒谱参数(PLPC).对PLPC参数和线性预测倒谱参数(LPCC)进行比较,得出使用8阶PLPC参数可以获得优于12阶LPCC参数的性能.采用基于PLPC参数的多种特征参数进行识别,非特定人识别率可以达到近97%. 展开更多
关键词 语声识别 感知线性预测 语声信号处理
下载PDF
一种简单有效的说话人身份认证方法 被引量:1
12
作者 于哲舟 周春光 +1 位作者 李佳慧 杨佳东 《吉林大学学报(信息科学版)》 CAS 2003年第S1期29-33,共5页
采用生物的特征识别技术,对说话人识别中说话人确认与说话人辨认的传统方法与分类进行了讨论,对现在使用的各种说话人识别算法进行了综合分析。以LPCC(Linear Prediction coding Coefficient)和MFCC(MEL Frequency Cestrum Coefficient... 采用生物的特征识别技术,对说话人识别中说话人确认与说话人辨认的传统方法与分类进行了讨论,对现在使用的各种说话人识别算法进行了综合分析。以LPCC(Linear Prediction coding Coefficient)和MFCC(MEL Frequency Cestrum Coefficient)两种特征参数提取为基础,对GMM(Gaussian MixtureModels),VQ(vector Quantization),DHMM(Discrete Hidden Markov Model),CHMM(Concatenation HiddenMarkov Model)等几种识别方法进行了实现,做到了真正的与文本无关。特别以GMM识别方法的部分实验结果为例进行分析,解决了系统中的阈值设置问题,改进了该方法的决策手段。根据实验数据,在各种方法中,说话人确认的错误拒识率和误识率相对说话人辨认总是较高,本文把说话人辨认的阈值选择方法应用于说话人确认,以多模板匹配方式为辅助,使得说话人确认的错误拒识率和误识率大大降低,并通过实验证明了该种改进方法的有效性。 展开更多
关键词 语声识别 身份认证 生物特征识别 文本无关
下载PDF
计算机辅助英语词汇统计研究
13
作者 杨惠中 黄人杰 《现代外语》 1980年第4期97-106,共10页
1.1 信息科学、材料科学和能源科学是现代科学技术的三大支柱。信息的主要载体是自然语言。近年来,随着计算机技术的发展,发达国家普遍重视自然语言的计算机处理,不断开拓出新的应用领域,如机器翻译、自然语言理解、情报检索、语声识别... 1.1 信息科学、材料科学和能源科学是现代科学技术的三大支柱。信息的主要载体是自然语言。近年来,随着计算机技术的发展,发达国家普遍重视自然语言的计算机处理,不断开拓出新的应用领域,如机器翻译、自然语言理解、情报检索、语声识别、人工智能以及计算机编词典、自动编文摘、语声打字、自动阅读等等。 展开更多
关键词 应用领域 现代科学技术 概率 频率分布 统计研究 应用软件包 语声识别 英语词汇 计算机辅助 自然语言理解
下载PDF
语音信号处理技术
14
作者 陈显治 《世界电信》 1995年第5期42-45,共4页
语音信号处理用以实现人-人、人-机器和机器-人的通信,是现代通信领域的重要环节。本文详细介绍了其三个分支,即语音编码、语音合成、语音识别与理解的研究和应用现状及其发展。
关键词 语声信号处理 语声编码 语声合成 语声识别
下载PDF
眼纹自动分析仪
15
作者 刘秉强 《中国仪器仪表》 1996年第3期36-37,共2页
眼纹自动分析仪视觉信息占人感觉器官所接受全部信息总量的84%,人的眼睛在现代身份鉴别中正在发挥着特殊的功能。美国科学家根据生物统计原理发明了一项“眼纹”鉴别新技术,或称视网膜扫描技术(TetinaScanTechno... 眼纹自动分析仪视觉信息占人感觉器官所接受全部信息总量的84%,人的眼睛在现代身份鉴别中正在发挥着特殊的功能。美国科学家根据生物统计原理发明了一项“眼纹”鉴别新技术,或称视网膜扫描技术(TetinaScanTechnology)。这项技术的实施目的是用... 展开更多
关键词 语声 声纹 自动分析仪 语声识别系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部