-
题名基于语速调整和音位属性后验概率的音素识别
被引量:5
- 1
-
-
作者
许友亮
张连海
张文林
李永彬
-
机构
信息工程大学信息工程学院
-
出处
《信号处理》
CSCD
北大核心
2012年第2期295-300,共6页
-
基金
国家自然科学基金(61175017)
-
文摘
基于语音事件检测的自动语音识别是当前研究的热点问题。针对说话人语速变化导致模型适应性差的问题,提出了一种语速自适应调整算法。该算法以语句为单位,采用连续变化的帧长与帧移间隔对语句进行归一化调整,使调整后速率与语料库平均速率一致,减小速率因素对模型训练的影响;另外,通过计算音位属性的后验概率向量间夹角,得到测试集的语速,相比采用训练模型的语速检测方法减轻了系统负担。本文将语速调整算法应用于音位属性的提取,并对音位属性特征进行非线性变换,最后采用隐马尔科夫模型进行建模,实验表明:经过语速调整后,音素的平均持续帧数较为恒定,动态变化范围减小,使得音素识别率提升了1.3%。
-
关键词
语速调整
音位属性检测
隐马尔可夫模型
自动语音识别
-
Keywords
Speaking Rate Adaptation
Phonological Attributes Detection
Hidden Markov Models
Automat-ic Speech Recognition
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于音位属性和边界信息的音素识别
被引量:6
- 2
-
-
作者
许友亮
张连海
牛铜
-
机构
解放军信息工程大学信息工程学院
-
出处
《数据采集与处理》
CSCD
北大核心
2013年第2期178-183,共6页
-
基金
国家自然科学基金(61175017)资助项目
-
文摘
在检测出音位属性的基础上,提出了一种基于音位属性后验概率的音素边界检测算法,并将音位属性与边界信息应用于基于条件随机场的音素识别。该方法首先计算得出相邻帧音位属性后验概率向量间的夹角,然后将夹角的极大值点所在的帧选为侯选边界,最后通过约束条件去除极值点中的错误边界。本文将音素边界与音位属性信息进行组合,作为基于条件随机场模型的识别系统的观测特征,实验结果表明,增加边界信息后,音素正确识别率有了显著提升。
-
关键词
音位属性
音素边界检测
自动语音识别
条件随机场
-
Keywords
phonological attributes
phone boundary detection
automatic speech recognition
conditional random field
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于长时性特征的音位属性检测方法
- 3
-
-
作者
许友亮
张连海
屈丹
牛铜
-
机构
解放军信息工程大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
2012年第11期160-162,166,共4页
-
基金
国家自然科学基金资助项目(61175017)
-
文摘
提出一种基于长时性信息的音位属性检测方法,该方法通过高、低两层时间延迟神经网络(TDNN)进行实现,低层TDNN在短时特征上进行音位属性的检测,高层TDNN在低层检测结果的基础上,对更长时段上的信息进行融合。实验结果表明,引入长时性特征使得音位属性检测率提升约3%,将音位属性后验概率作为音素识别系统的观测特征,使用长时性特征的识别结果提升约1.7%。
-
关键词
音位属性
长时特征
层级结构
人工神经网络
隐马尔可夫模型
音素识别
-
Keywords
phonological attribute
long-term features
hierarchical structure
Artificial Neural Network(ANN)
Hidden Markov Model(HMM)
phoneme classification
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名职校语文教学生活化的实践研究
- 4
-
-
作者
许友亮
-
机构
江苏省盐城机电高等职业技术学校
-
出处
《学苑教育》
2013年第16期36-36,共1页
-
文摘
生活化的语文教学加强了教学内容与学生实际生活的联系,加强了语文的应用与实践,提高学生利用语文知识来解决实际问题的能力,提高了学生的学习兴趣。
-
关键词
语文教学
生活化
口语
-
分类号
G41
[文化科学—教育技术学]
-
-
题名一种融合IB准则特征的说话人分段聚类方法
- 5
-
-
作者
张力
张连海
许友亮
-
机构
信息工程大学信息工程学院
-
出处
《太赫兹科学与电子信息学报》
2013年第1期136-141,共6页
-
基金
国家自然科学基金资助项目(61175017)
-
文摘
针对说话人分段与聚类算法中先验知识不足的问题,利用基于信息瓶颈(IB)准则和基于隐马尔科夫模型(HMM)/高斯混合模型(GMM)方法间的互补性,提出了一种基于特征层融合的说话人分段与聚类算法。该算法将基于IB准则算法的输出结果进行对数变换和降维处理;然后利用变换后的特征与传统梅尔频率倒谱系数(MFCC)特征分别训练说话人GMM模型,并在得分域对说话人类别的得分进行加权融合;根据融合的得分,进行基于HMM/GMM模型的说话人分段与聚类。实验表明,融合后的特征可以为系统提供更多的先验信息,比传统方法的误配率降低了1.2%。
-
关键词
信息瓶颈准则
说话人分段聚类
HMM
GMM模型
系统融合
-
Keywords
Information Bottleneck principle
speaker segmentation and clustering
Hidden MarkovModel/Gaussian Mixture Model
system combination
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名组织内上下级关系的辩证思考
- 6
-
-
作者
许友亮
-
机构
中科铜都粉体新材料股份有限公司
-
出处
《铜业工程》
CAS
2017年第3期15-19,共5页
-
文摘
中国组织情境内上下级关系(SSG)是人际关系中最重要的关系。根据管理实践,通过管理案例分析组织内上下级关系的外在表现形态及其行为结果;树立"一切以目标为先"的思想,以力争寻求"组织目标的一致性"为指挥棒,以信任为根基,从唯物辩证法的角度,通过多途径、多方法,将上下级关系中的对立关系、边缘关系转化为和谐的一致关系,从而促进组织整体目标的实现。
-
关键词
上下级关系
组织目标
辩证
和谐
转化
-
Keywords
upper and lower relations
organizational objectives
dialectical
harmony
conversion
-
分类号
F272.92
[经济管理—企业管理]
-