-
题名基于音素后验概率和层次凝聚聚类算法的音素边界检测
- 1
-
-
作者
冯志远
张连海
-
机构
信息工程大学信息系统工程学院
-
出处
《太赫兹科学与电子信息学报》
2014年第2期260-265,共6页
-
基金
国家自然科学基金资助项目(61175017)
-
文摘
提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。
-
关键词
音素边界检测
音素后验概率
层次凝聚聚类
-
Keywords
phoneme boundary detection
phoneme posterior probability
hierarchical agglomerative clustering
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于语谱能量的音素边界检测
被引量:1
- 2
-
-
作者
李立永
张连海
冯志远
-
机构
信息工程大学信息系统工程学院
-
出处
《太赫兹科学与电子信息学报》
2013年第6期936-941,共6页
-
基金
国家自然科学基金资助项目(61175017)
-
文摘
根据音素发音时语谱结构的变化提出了一种基于语谱能量的音素边界检测方法。该方法首先根据语谱结构变化特点将信号频域划分为高频、中频、低频3个区域,并以语音帧间语谱能量向量的欧氏距离为判别依据分别对3个区域进行音素边界检测,然后对3个区域检测的边界分别进行二次筛选,最后将3个区域的边界信息融合,得到音素边界检测结果,相对于基于音素属性的边界检测方法,计算复杂性大大降低,边界检测率提高了3.95%。
-
关键词
音素边界检测
语谱能量
语音事件
-
Keywords
phone boundary detection
spectrum
speech event
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于音位属性和边界信息的音素识别
被引量:6
- 3
-
-
作者
许友亮
张连海
牛铜
-
机构
解放军信息工程大学信息工程学院
-
出处
《数据采集与处理》
CSCD
北大核心
2013年第2期178-183,共6页
-
基金
国家自然科学基金(61175017)资助项目
-
文摘
在检测出音位属性的基础上,提出了一种基于音位属性后验概率的音素边界检测算法,并将音位属性与边界信息应用于基于条件随机场的音素识别。该方法首先计算得出相邻帧音位属性后验概率向量间的夹角,然后将夹角的极大值点所在的帧选为侯选边界,最后通过约束条件去除极值点中的错误边界。本文将音素边界与音位属性信息进行组合,作为基于条件随机场模型的识别系统的观测特征,实验结果表明,增加边界信息后,音素正确识别率有了显著提升。
-
关键词
音位属性
音素边界检测
自动语音识别
条件随机场
-
Keywords
phonological attributes
phone boundary detection
automatic speech recognition
conditional random field
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于能量谱熵的英语摩擦音检测方法
- 4
-
-
作者
李立永
张连海
-
机构
解放军信息工程大学信息系统工程学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第6期554-560,共7页
-
文摘
根据摩擦音发声时的频谱特点,提出一种基于能量谱熵的摩擦音检测方法.该方法首先利用不同音素的语谱能量特点检测出音素边界.然后计算每个语音段的能量谱熵,并将超过阈值的语音段作为候选.最后根据语音段的长度、开始结束时的能量突变等对特征候选语音段后处理,去除错误候选.实验表明,在干净环境中并且容错误差为20 ms时,摩擦音的检测率达到96.9%.
-
关键词
能量谱熵
摩擦音检测
音素边界检测
-
Keywords
Energy Spectrum Entropy, Fricative Detection, Phone Boundary Detection
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于区分性特征的音素识别
- 5
-
-
作者
李立永
张连海
-
机构
信息工程大学
-
出处
《信息工程大学学报》
2013年第6期692-699,共8页
-
基金
国家自然科学基金资助项目(61175017)
-
文摘
针对当前主流的基于统计模型的语音识别系统没有使用语音产生知识的问题,通过模拟人类的语音感知理解过程提出了一种"自下而上"的基于区分性特征的音素识别方法。该方法首先根据不同音素的发音特点检测得到音素的边界信息;然后利用分类器完成语音的区分性特征检测,并根据区分性特征与音素的对应关系建立映射表;最后利用音素的边界信息得到语音段的特征序列,通过对语音段的特征序列模糊搜索匹配实现音素识别。实验结果表明,相比于传统的基于隐马尔科夫模型的音素识别方法,该方法在识别速度、鲁棒性及可扩展性等方面具有明显优势。
-
关键词
语音产生知识
音素边界检测
区分性特征
音素识别
模糊匹配
-
Keywords
speech production knowledge
phone boundaries detection
distinctive feature
pho- neme recognition
fuzzy matching
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-