-
题名一种基于动态平滑的实时基频提取算法
被引量:1
- 1
-
-
作者
胡海洋
原猛
冯海泓
-
机构
中国科学院声学研究所东海研究站
中国科学院研究生院
-
出处
《声学技术》
CSCD
2012年第6期583-588,共6页
-
基金
国家自然科学基金资助项目(11104316)
上海自然科学基金资助项目(11ZR1446000)
-
文摘
基频是语音信号处理中的一个基本声学特征。传统的基频提取算法为了获得较好的检测效果,需要复杂的时频域计算。对于资源受限的应用条件,例如人工耳蜗等嵌入式实时系统,很难应用计算量大的基频提取算法。语音信号的基频具有短时平稳性,根据这个特点来确定基频候选值可以提高提取的准确性。据此,提出一种基于动态平滑的基频提取算法,使用此算法对汉语声调词库进行基频提取,并与另外两种基频提取算法进行比较。实验结果表明,新算法的基频绝对平均估计误差小于3Hz,优于另两种算法,能够准确地提取基频,同时算法计算量低,适合实时应用。
-
关键词
基频提取
动态平滑
实时处理
-
Keywords
pitch detection
dynamic smoothing
real-time
-
分类号
N912.3
[自然科学总论]
-
-
题名应对说话人位置突变的鲁棒语声去混响
- 2
-
-
作者
吴礼福
孙帅恒
王雷
孙芯年
-
机构
南京信息工程大学电子与信息工程学院
江苏省大气环境与装备技术协同创新中心
-
出处
《应用声学》
CSCD
北大核心
2022年第6期851-859,共9页
-
基金
国家自然科学基金项目(12074192)。
-
文摘
多通道线性预测算法是一种有效的语声去混响方法,但若房间内说话人位置发生变化,房间冲激响应也会随之改变,从而导致去混响效果变差。该文研究了基于递归最小二乘算法的自适应多通道线性预测语声去混响方法,提出了一种去混响过程中检测说话人位置突变的方法,它借助已有的多通道传声器信号,并未明显增加系统开销。实验表明该方法可以有效检测说话人位置的突变,并通过重置滤波器改善算法的收敛速度和稳定性。
-
关键词
去混响
多通道线性预测
递归最小二乘
-
Keywords
Dereverberation
Multi-channel linear prediction
Recursive least square
-
分类号
N912.35
[自然科学总论]
-
-
题名智能语音识别技术在金融交易系统中的应用研究
- 3
-
-
作者
崔伟欣
-
机构
河南工业和信息化职业学院
-
出处
《电声技术》
2024年第12期70-72,共3页
-
文摘
随着智慧金融的快速发展,智能语音识别技术在金融交易系统中的应用已逐渐成为学术研究的重点领域。首先阐述智能语音识别技术的基本概念,其次分析其在金融交易系统中的应用优势、存在的问题,最后针对问题提出相应的策略,旨在为金融交易系统的智能化发展提供理论依据和实践指导。
-
关键词
智能语音识别
金融交易系统
智慧金融
-
Keywords
intelligent speech recognition
financial transaction system
smart finance
-
分类号
N912.33
[自然科学总论]
F830
[经济管理]
TP391
[经济管理—金融学]
-