期刊文献+
共找到77篇文章
< 1 2 4 >
每页显示 20 50 100
基于双源域迁移学习的肺音信号识别 被引量:1
1
作者 包善书 车波 邓林红 《计算机工程》 CAS CSCD 北大核心 2023年第9期295-302,312,共9页
针对目前肺音识别中因肺音数据集规模较小所致模型过拟合分类精度低的问题,提出一种基于双源域迁移学习的肺音识别方法。一方面,将音频数据集Audio Set上的预训练模型VGGish网络迁移至肺音识别中,融合高效通道注意力ECA-Net以增强识别能... 针对目前肺音识别中因肺音数据集规模较小所致模型过拟合分类精度低的问题,提出一种基于双源域迁移学习的肺音识别方法。一方面,将音频数据集Audio Set上的预训练模型VGGish网络迁移至肺音识别中,融合高效通道注意力ECA-Net以增强识别能力,然后提取肺音的对数梅尔频率谱特征,使用VGGish网络按照时序学习谱图中的信息,并对VGGish网络输出的特征向量经不同大小和扩张率的一维卷积核进行特征增强,将增强后的特征图输入双向门控循环单元以捕获肺音的时序信息;另一方面,将图像数据集ImageNet上的预训练模型VGG19迁移至肺音识别中,将肺音波形数据转换为谱图的形式输入并训练。将两方面的模型训练后作为特征提取器,融合具有高层语义的特征向量融合并输入集成学习算法CatBoost,实现最终的分类。实验结果表明,该方法对Coswara新冠数据集中肺音识别的特异性、敏感性指标和准确率分别达到80.66%、77.69%和79.18%,对ICBHI-2017数据集中肺音识别的特异性、敏感性指标和ICHBI-score分别达到88.75%、72.04%和80.39%,均优于对比的常见识别方法。 展开更多
关键词 识别 迁移学习 通道注意力 对数梅尔频率谱 集成学习
下载PDF
靶音识别作业对脑波α段频率涨落特征的影响 被引量:5
2
作者 韩东旭 周传岱 +1 位作者 刘月红 庞立伟 《航天医学与医学工程》 CAS CSCD 北大核心 2004年第1期30-34,共5页
目的研究靶音识别作业对脑波α段频率涨落特征的影响及各优势成分的作业相关变化。方法被试为 2 1名右利手、听力及EEG正常男性 ( 2 5~ 35岁 ) ,记录被试闭眼状态下安静及靶音识别作业过程中的 1 2导EEG信号 ,利用脑波频率涨落分析技... 目的研究靶音识别作业对脑波α段频率涨落特征的影响及各优势成分的作业相关变化。方法被试为 2 1名右利手、听力及EEG正常男性 ( 2 5~ 35岁 ) ,记录被试闭眼状态下安静及靶音识别作业过程中的 1 2导EEG信号 ,利用脑波频率涨落分析技术分析 8、9、1 0、1 1、1 2、1 3Hz 6个频率成分的优势涨落特征。结果靶音识别作业导致脑波α段频率涨落竞争结构中的主涨落成分向高频方向发展 ,9~ 1 0Hz优势显著下降 ,1 1~ 1 3Hz优势显著增加 ,各频率成分在频率竞争结构中的地位和相互作用改变 ;同时 ,作业相关的优势成分快化与各被试静态EEG有关 ,即围绕静态EEG功谱峰值频率 ,较高频率成分优势几率明显增加 ,较低频率成分优势几率则明显减少。结论靶音识别作业导致脑波α段频率涨落特征的显著改变可能反映了与作业负荷有关的脑一般机能状态的增强 。 展开更多
关键词 脑电图 识别 频率涨落分析 作业负荷 评价 听觉
下载PDF
非特定人普通话孤立数字音识别系统 被引量:2
3
作者 王舟 谢锦辉 《华中理工大学学报》 EI CAS CSCD 北大核心 1994年第11期36-39,共4页
通过分析汉语语音及非特定人语音特点,选择过零率、能量、基音周期和前两个共振峰作为语音特征,用音素分类的方法构造判决树,在此基础上,给出了一个非特定人普通话孤立数字音(0~9)识别系统,识别率大约为96.6%。
关键词 数字识别 分析 识别
下载PDF
基于柯氏音识别法的自动血压测量系统 被引量:9
4
作者 袁苑 薛雷 何金胜 《电子测量技术》 2012年第2期76-79,共4页
市场上的电子血压计一般均采用示波法,采用间接测量原理,其准确性难以提高;柯氏音法是血压测量的金标准,有望提高自动血压测量准确性,但柯氏音的降噪和识别是难题。因此,提出了基于柯氏音识别法的自动血压测量系统,该系统解决了降噪和... 市场上的电子血压计一般均采用示波法,采用间接测量原理,其准确性难以提高;柯氏音法是血压测量的金标准,有望提高自动血压测量准确性,但柯氏音的降噪和识别是难题。因此,提出了基于柯氏音识别法的自动血压测量系统,该系统解决了降噪和识别的难题,通过对实时柯氏音信号的测试表明该系统可以有效地识别出柯氏音,得出收缩压和舒张压,识别精度高。且该系统成本低廉,可操作于Android系统的手机上,易于实现社区血压的健康管理和远程监控。 展开更多
关键词 柯氏识别 自动血压测量系统
下载PDF
基于肺音谱图Hough变换的喘鸣音识别方法 被引量:2
5
作者 张柯欣 龙哲 +1 位作者 王雪峰 赵宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第11期1534-1537,共4页
提出了一种基于Hough变换从肺音的STFT光谱图中检测喘鸣音的方法.这一方法先对采集的数字肺音数据的STFT谱图进行ROI区域的截取,再利用Canny算子进行图像边缘检测,最后基于Hough变换数据的分析来自动识别喘鸣音.临床分析的数据包括临床... 提出了一种基于Hough变换从肺音的STFT光谱图中检测喘鸣音的方法.这一方法先对采集的数字肺音数据的STFT谱图进行ROI区域的截取,再利用Canny算子进行图像边缘检测,最后基于Hough变换数据的分析来自动识别喘鸣音.临床分析的数据包括临床采集的肺音和国际上共享的肺音文件.Hough变换检测方法在60例喘鸣音的检测中达到了87%的准确率,70例正常呼吸音的识别率达到74%. 展开更多
关键词 喘鸣 HOUGH变换 STFT变换 光谱图 识别
下载PDF
基于MFCC,MODGDF和支持向量机的环境音识别研究 被引量:4
6
作者 任立勇 何永彬 +2 位作者 贺茜 于永斌 刘思怡 《河南理工大学学报(自然科学版)》 CAS 北大核心 2020年第6期127-132,共6页
环境音识别是机器学习领域中的一个研究重点和难点,它可以帮助智能系统识别音频数据中的环境音。本文提出一种新的环境音识别方法,它是将梅尔频率倒谱系数(mel frequency cepstral coefficents,MFCC)和修正群延迟函数(modified group de... 环境音识别是机器学习领域中的一个研究重点和难点,它可以帮助智能系统识别音频数据中的环境音。本文提出一种新的环境音识别方法,它是将梅尔频率倒谱系数(mel frequency cepstral coefficents,MFCC)和修正群延迟函数(modified group delay function,MODGDF)联合作为特征参数,然后利用多分类支持向量机(support vector machine,SVM)进行参数分类,达到识别音频数据中环境音的目的。结果表明,在DCASE 2018数据集上,该方法的实验效果优于DCASE 2018数据集基线系统识别效果,整体识别准确率提高了25.8%。 展开更多
关键词 环境识别 梅尔频率倒谱系数 修正群延迟函数 支持向量机
下载PDF
噪音环境下语音识别理解系统的研究 被引量:1
7
作者 江铭虎 袁保宗 林碧琴 《铁道学报》 EI CAS CSCD 北大核心 1997年第6期73-77,共5页
根据人对语言的认知过程提出了含噪语音识别理解的模型,语音识别采用两级模块扩展联想记忆神经网络,第一级扩展联想网络将待识别语音类分组,第二级分支扩展联想网络实现各自组内的区分,两级模块扩展联想网络的学习速度比传统BP网... 根据人对语言的认知过程提出了含噪语音识别理解的模型,语音识别采用两级模块扩展联想记忆神经网络,第一级扩展联想网络将待识别语音类分组,第二级分支扩展联想网络实现各自组内的区分,两级模块扩展联想网络的学习速度比传统BP网络快9倍,它对噪音语音信号具有很高的自适应性、鲁棒性、容错性和联想记忆能力。语音理解提取语音识别的候选词,采用统计推理和句法规则相结合的多层分析查错的结构,由统计推断库预测下一词,句法规则库将有效地减少声学层的识别错误和候选词,通过信息反馈来比较、纠正错误,引导后续的语音处理,以实现句子的识别。 展开更多
关键词 神经网络 理解 识别
下载PDF
基于柯氏音识别法的自动血压测量系统
8
作者 袁苑 薛雷 何金胜 《生物医学工程学进展》 CAS 2011年第4期185-188,共4页
市场上的电子血压计一般均采用示波法,采用间接测量原理,其准确性难以提高。柯氏音法是血压测量的金标准,有望提高自动血压测量准确性,但柯氏音的降噪和识别是难题。因此,提出了基于柯氏音识别法的自动血压测量系统,该系统解决了降噪和... 市场上的电子血压计一般均采用示波法,采用间接测量原理,其准确性难以提高。柯氏音法是血压测量的金标准,有望提高自动血压测量准确性,但柯氏音的降噪和识别是难题。因此,提出了基于柯氏音识别法的自动血压测量系统,该系统解决了降噪和识别的难题,通过对实时柯氏音信号的测试表明该系统可以有效地识别出柯氏音,得出收缩压和舒张压,识别精度高。且该系统成本低廉,测试实验均造作于Android系统的手机上,易于实现社区血压的健康管理和远程监控。 展开更多
关键词 柯氏识别 自动血压测量系统
下载PDF
基于三维卷积神经网络的虫音特征识别方法
9
作者 万永菁 王博玮 娄定风 《计算机应用》 CSCD 北大核心 2019年第9期2744-2748,共5页
进口木材蛀虫检疫是海关的一项重要工作,但其存在着虫声检测算法准确率低、鲁棒性差等问题。针对这些问题,提出了一种基于三维卷积神经网络(3D CNN)的虫音检测方法以实现虫音特征的识别。首先,对原始虫音音频进行交叠分帧预处理,并使用... 进口木材蛀虫检疫是海关的一项重要工作,但其存在着虫声检测算法准确率低、鲁棒性差等问题。针对这些问题,提出了一种基于三维卷积神经网络(3D CNN)的虫音检测方法以实现虫音特征的识别。首先,对原始虫音音频进行交叠分帧预处理,并使用短时傅里叶变换得到虫音音频的语谱图;然后,将语谱图作为3D CNN的输入,使其通过包含三层卷积层的3D CNN以判断音频中是否存在虫音特征。通过设置不同分帧长度下的输入进行网络训练及测试;最后以准确率、F 1分数以及ROC曲线作为评估指标进行性能分析。结果表明,在交叠分帧长度取5 s时,训练及测试效果最佳。此时,3D CNN模型在测试集上的准确率达到96.0%,F 1分数为0.96,且比二维卷积神经网络(2D CNN)模型准确率提高近18%。说明所提算法能准确地从音频信号中提取虫音特征并完成蛀虫识别任务,为海关检验检疫提供有力保障。 展开更多
关键词 三维卷积神经网络 短时傅里叶变换 语谱图 识别 声学信号处理
下载PDF
PMC在噪声环境下的语音识别中的应用 被引量:1
10
作者 金连斌 丁庆海 陈显治 《解放军理工大学学报(自然科学版)》 EI 2001年第2期42-45,共4页
今天的语音识别正处于由实验室技术走向实用化、产品化的关键时期。然而 ,现有的绝大多数语音识别系统在噪声环境中的性能都不可避免地急剧下降。环境噪声已经成为语音识别技术商品化的一个主要障碍。因此在语音识别技术逐渐走向实用化... 今天的语音识别正处于由实验室技术走向实用化、产品化的关键时期。然而 ,现有的绝大多数语音识别系统在噪声环境中的性能都不可避免地急剧下降。环境噪声已经成为语音识别技术商品化的一个主要障碍。因此在语音识别技术逐渐走向实用化的过程中 ,噪声语音识别日益成为一个重要的研究领域。遗憾的是 ,由于噪声语音识别问题本身的复杂性 ,至今还没有一种方法可以圆满地解决这一问题。拟从模型补偿方面 ,对噪声环境下的孤立词语音识别进行一些探索。重点研究一个在噪声环境下的语音识别算法——并行模型组合方法 (PMC) ,详细论述了其原理以及在噪声环境下的语音识别中的应用。实验中 ,我们使用汉语的数字语音 ,分别在 3种不同噪声不同信噪比条件下对这一方法进行了识别率测试 ,结果显示 ,该方法有着令人振奋的识别效果。 展开更多
关键词 并行模型组合方法 识别 镁倒谱系数 PMC 噪声环境
下载PDF
基于语谱图的改进型LBP肺音识别
11
作者 曹春雷 王双维 +2 位作者 吴颜生 柴宗谦 梁士利 《东北师大学报(自然科学版)》 CAS 北大核心 2019年第1期81-85,共5页
为了准确区分各种肺音信号,获得更理想的肺音识别效果,提出了一种基于语谱图的改进型LBP肺音识别方法.首先通过短时傅里叶变换将肺音信号转化为灰度语谱图;其次利用改进后LBP算法计算语谱图的局部纹理关系,将局部二值模式特征进行级联... 为了准确区分各种肺音信号,获得更理想的肺音识别效果,提出了一种基于语谱图的改进型LBP肺音识别方法.首先通过短时傅里叶变换将肺音信号转化为灰度语谱图;其次利用改进后LBP算法计算语谱图的局部纹理关系,将局部二值模式特征进行级联构成特征向量;最后利用支持向量机对正常肺音和三类异常肺音信号进行识别分类.结果表明,该方法对不同肺音信号的识别率可达92.59%,为肺部疾病的医疗诊断提供了新的思路. 展开更多
关键词 识别 语谱图 改进型LBP算法 支持向量机
下载PDF
电话频带汉语普通话连续语音识别
12
作者 成德源 张小绵 《深圳大学学报(理工版)》 CAS 1996年第1期24-26,共3页
基于帧能量参数和帧与稳态背景噪声状态之间的失真度,将连续的电话频带汉语语音信号分割至用隐马尔可夫链模型表示的以字为单位的语音,采用动态时间规正算法和最小失真度准则,作以字为单位的语音识别,从而实现连续语音识别.实验表... 基于帧能量参数和帧与稳态背景噪声状态之间的失真度,将连续的电话频带汉语语音信号分割至用隐马尔可夫链模型表示的以字为单位的语音,采用动态时间规正算法和最小失真度准则,作以字为单位的语音识别,从而实现连续语音识别.实验表明电话频带连续语音识到正确率达到75%. 展开更多
关键词 动态时间规正 识别 普通话 电话频带语
下载PDF
发音特征在维汉语音识别中的应用
13
作者 秦春香 黄浩 《计算机工程》 CAS CSCD 2012年第23期177-180,共4页
采用传统谱特征作为输入进行语音识别通常会受到声学环境差异的影响。为此,提出汉语和维语音素和音位的对应规则,并将这种规则应用于基于发音特征的语音识别系统。训练神经网络多层感知器,获取语音信号各类发音特征的后验概率,将其与美... 采用传统谱特征作为输入进行语音识别通常会受到声学环境差异的影响。为此,提出汉语和维语音素和音位的对应规则,并将这种规则应用于基于发音特征的语音识别系统。训练神经网络多层感知器,获取语音信号各类发音特征的后验概率,将其与美尔频率倒谱系数(MFCC)拼接后送入隐马尔科夫模型进行声学模型训练。将不同发音特征分别与传统MFCC特征进行组合并给出测试结果。实验结果表明,当汉语声带状况和送气发音特征与传统MFCC组合时,以及维语的发音方式和声带状况特征与MFCC组合之后,系统误识率较低。 展开更多
关键词 维汉语识别 多层感知器 声学模型 美尔频率倒谱系数 特征组合
下载PDF
用于SOM神经网络语音识别的自适应局部搜索算法 被引量:1
14
作者 胡光锐 吴硕 朱昕波 《上海交通大学学报》 EI CAS CSCD 北大核心 1996年第7期130-133,共4页
采用一种基于自组织特征映射(SOM)神经网络和隐马尔柯夫模型(HMM)法结合的语音识别方法.根据语音信号的相关性,提出了一种自适应局部搜索算法.结果表明,该算法相对于全搜索算法而言。
关键词 SOM神经网络 识别 局部搜索算法
下载PDF
基于汉语声母韵母发音模型的语音识别 被引量:1
15
作者 鲍欣 林其璈 张英芳 《西北工业大学学报》 EI CAS CSCD 北大核心 1992年第2期174-180,共7页
每个汉字的发音都是由声母、韵母两部分构成的。声母部分发音时间短,信号变化剧烈;而韵母部分发音时间长,信号相对比较平稳。传统的孤立字识别方案是以线性预测系数作为语音模型系数,用动态时间弯折算法进行模式匹配,但它不完全适用于... 每个汉字的发音都是由声母、韵母两部分构成的。声母部分发音时间短,信号变化剧烈;而韵母部分发音时间长,信号相对比较平稳。传统的孤立字识别方案是以线性预测系数作为语音模型系数,用动态时间弯折算法进行模式匹配,但它不完全适用于汉语的单音节识别。本文中利用语音信号相邻帧间LPC距离的变化进行声母、韵母分割,并根据声母、韵母的不同特性分别建立模式,提高了声母部分在整个音节模式中的比重,同时大幅度降低了模式的数据量。实验结果表明,汉语单音节的识到速度较传统的LPC/CTW算法提高一倍以上,识别正确率达到95% 展开更多
关键词 识别 汉语 声母 韵母 计算机
全文增补中
模型水轮机初生空化的特征谱提取识别方法 被引量:3
16
作者 韩文福 倪晋兵 +5 位作者 桂中华 满哲 丁景焕 肖微 李东阔 汪刚 《水力发电学报》 CSCD 北大核心 2023年第8期69-79,共11页
目前水轮机模型初生空化识别方法仍采用人工识别法,这种方法获得结果的周期较长、主观性强、准确度及效率都较低。针对于此,对水轮机模型初生空化识别方法进行了研究与优化创新,提出了一种基于炮声谱与特殊脉动谱特征提取的水轮机空化... 目前水轮机模型初生空化识别方法仍采用人工识别法,这种方法获得结果的周期较长、主观性强、准确度及效率都较低。针对于此,对水轮机模型初生空化识别方法进行了研究与优化创新,提出了一种基于炮声谱与特殊脉动谱特征提取的水轮机空化智能识别方法,即多态泡音智能识别方法 PSVFR。该方法依据自主开发的水轮机空化噪声多态算法MTCSPC,对数据进行处理,通过采集初生空化音态特征向量,建立矩阵模型,与样本数据库中的定性矩阵进行特征比对、计算、判断,以帮助机器完成对模型水轮机空化噪声的学习和识别。与现有技术相比,该方法能够提高机器对水轮机初生空化现象的识别准确度和识别效率,识别效率可达80%。 展开更多
关键词 模型水轮机空化 空化识别 智能识别 态特征向量 特征谱
下载PDF
一种基于概率统计的汉语语音识别输入方法
17
作者 王景寅 朱伟中 《微型电脑应用》 1992年第4期75-79,共5页
关键词 概率 统计 汉语 识别 输入
下载PDF
T6658A语音识别电路及应用
18
作者 张天石 《广东电子》 1994年第1期41-46,共6页
关键词 合成 识别 识别电路
下载PDF
小学中、高年级学生识别汉语成语的信号检测论分析 被引量:2
19
作者 叶一舵 《心理学报》 1985年第1期86-91,共6页
本实验结果表明,被试识别音同、义同、形近三类成语材料有不同的效果。形近的识别最差,音同与义同只有在同一成语中共同存在,才容易混淆。四种识记方法相比,字形识记的识别效果最好,一般识记最差,意义识记和读音识记随年级不同而不同。... 本实验结果表明,被试识别音同、义同、形近三类成语材料有不同的效果。形近的识别最差,音同与义同只有在同一成语中共同存在,才容易混淆。四种识记方法相比,字形识记的识别效果最好,一般识记最差,意义识记和读音识记随年级不同而不同。在识记方法与材料性质相一致时,三年级被试都识别较差,而五年级被试使用字形识记对各种材料都识别较好,并且意义识记的识别效果显著提高。 展开更多
关键词 信号检测论 汉语成语 小学中高年级学生 识记方法 意义识记 识别效果 同而不同 识别音 材料性质 实验结果
下载PDF
基于多模态融合的端到端中文唇读识别研究
20
作者 陈焯辉 林绰雅 +3 位作者 刘奕显 王茗琛 梁思敏 陈灵 《科学技术创新》 2023年第10期85-88,共4页
为了更好地帮助健全人与听障或语言障碍人士进行交流,构建无障碍社会。构建了一个基于多模态融合的端到端音视频识别系统,实现中文唇语翻译功能。实验结果表明,将所提出的端到端视听语音识别结构体系应用于唇语识别模型,实现了8.0%的字... 为了更好地帮助健全人与听障或语言障碍人士进行交流,构建无障碍社会。构建了一个基于多模态融合的端到端音视频识别系统,实现中文唇语翻译功能。实验结果表明,将所提出的端到端视听语音识别结构体系应用于唇语识别模型,实现了8.0%的字符错误率。与之前的唇语识别模型相比,它在融合图像特征和音频特征方面表现出了良好的性能。 展开更多
关键词 端到端视觉语识别结构体系 多模态融合 唇语识别
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部