贵州省中部苗语音素边界检测方法研究被引量：2

Study on the Method of Phoneme Boundary Detection of Miao Language in the Middle of Guizhou Province

下载PDF

导出

摘要音素分割是语音研究的一个主要组成部分,在大词汇量连续语音识别及语音合成的过程中起着重要的作用。文章以贵州省中部苗语作为研究对象,对其进行特征的提取和音素边界划分。通过对录音的频谱能量进行低频、中频和高频的均值计算,找到各个频段均值点组成的波形突变点作为边界,去掉宽度低于20 ms的边界,然后将得到的边界点进行排序,再一次筛选出宽度大于20 ms的边界,得出划分的边界点。在一定的容错范围内,准确率能够达到83%。 Phoneme segmentation is a main components of speech research,it plays an important role in large vocabulary continuous speech recognition and speech synthesis.In this paper,Miao language in the middle of Guizhou Province is taken as the research object,and its feature extraction and phoneme boundary division are carried out.The mean value of low frequency,intermediate frequency and high frequency is calculated through the spectrum energy of recording.Find the wave mutation point composed of the mean points of each frequency band as the boundary and remove boundary with width less than 20 ms.Then the boundary points are sorted,and the boundary points with a width of more than 20 ms are screened out again to get the boundary points.The accuracy can reach 83%in a certain range of fault tolerance.

作者李学林赵冬梅梁明秀 LI Xuelin;ZHAO Dongmei;LIANG Mingxiu(Guizhou Minzu University,Guiyang 550025,China)

机构地区贵州民族大学

出处《现代信息科技》 2020年第3期19-21,共3页 Modern Information Technology

基金贵州民族大学校级课题([2018]5773-QN02)。

关键词苗族语音 Praat标注语谱能量语音分割 Miao nationality’s voice Praat annotation spectrogram energy speech segmentation

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1李立永,张连海,冯志远.基于语谱能量的音素边界检测[J].太赫兹科学与电子信息学报,2013,11(6):936-941. 被引量：1
2刘豫军,夏聪.语音合成音库自动标注方法研究[J].网络安全技术与应用,2015(2):65-66. 被引量：1
3李永宏,于洪志,孔江平.藏语连续语音语料库设计与实现[J].计算机工程与应用,2010,46(13):233-235. 被引量：10

二级参考文献15

1李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报（自然科学版）,2008,48(S1):621-626. 被引量：20
2曹剑芬.普通话双音子和三音子结构系统代表语料集[J].语言文字应用,1997(1):62-70. 被引量：7
3曹剑芬.普通话语音的环境音变与双音子和三音子结构[J].语言文字应用,1996(2):58-63. 被引量：11
4王仁华,倪晋富.从音联出发设计语音库语料[J].计算机应用与软件,1994,11(1):30-35. 被引量：1
5Malfrere F,Dutiot T. High-quality speech synthesis for phonetic speech segmentation[A].Rhodes,Greece:[s.n.],1997.2631-2663.
6Wang Yih-Ru. A Two-Stage Sample-based Phone Boundary Detector using Segmental Similarity Features[A].Florence,Italy:[s.n.],2011.413-416.
7Stevens K N. Toward a model of lexical access based on acoustic landmarks and distinctive features[J].{H}Journal of the Acoustical Society of America,2002,(04):1372-1891.
8Thomas F Quatieri. Discrete-Time Speech Signal Processing:Principles and Practice[M].S.l:Prentice Hall PTR,2001.
9Liu Anne Sharlene. Landmark Detection for Distinctive Feature-Based Speech Recognition[J].{H}Journal of the Acoustical Society of America,1996,(05):3417-3430.
10Park Chiyoun. Consonant Landmark Detection for Speech Recognition[EB/OL].http://dspace.mit.edu/bitstream/handle/1721.1/44905/297548228.pdf sequence=1.2008:75-77,2012.

共引文献9

1张小燕,宿建军,薛化建,王磊.维吾尔语语音识别语料库中的OOV研究[J].计算机工程与设计,2012,33(2):772-776. 被引量：4
2陈小莹.藏语拉萨话语音合成语料库的研究与建立[J].科技信息,2013(9):13-14. 被引量：3
3才让卓玛,李永明,才智杰.藏语语音合成单元选择[J].软件学报,2015,26(6):1409-1420. 被引量：5
4陈小莹,艾金勇.藏语拉萨话元音共振峰声学分析[J].西藏民族学院学报（哲学社会科学版）,2016,37(3):110-115. 被引量：2
5黄晓辉,李京,马睿.藏语口语语音语料库的设计与研究[J].计算机工程与应用,2018,54(13):231-235. 被引量：8
6刘晓峰,宋文爱,余本国,郇晋侠,陈小东,李志媛.基于注意力机制的大同方言语音翻译模型研究[J].中北大学学报（自然科学版）,2020,41(3):238-243. 被引量：9
7洋宗,更太加,魏建国,石海强.藏语安多方言语音合成语料库的设计与构建[J].青海科技,2023,30(5):163-169.
8袁子林,张瑞,张彩霞,魏欢,巩海平.民族语言的语音识别研究[J].计算机应用文摘,2024,40(1):81-83.
9高欢.中国濒危语言语料库建设初探——以广西融水诶话语料库为例[J].民族论坛,2015(5):97-99.

同被引文献20

1韩清华,于洪志.基于HMM的安多藏语非特定人孤立词语音识别研究[J].软件导刊,2010,9(7):173-175. 被引量：9
2张继勇,sp.cs.tsinghua.edu.cn,郑方,sp.cs.tsinghua.edu.cn,杜术,sp.cs.tsinghua.edu.cn,宋战江,sp.cs.tsinghua.edu.cn,徐明星,sp.cs.tsinghua.edu.cn.连续汉语语音识别中基于归并的音节切分自动机[J].软件学报,1999,10(11):1212-1215. 被引量：10
3阿依木尼萨.胡甫尔,艾斯卡尔.艾木都拉.面向语音合成的维吾尔语音素自动切分算法研究[J].计算机应用与软件,2011,28(9):18-21. 被引量：4
4徐利军.基于DTW的孤立词语音识别研究[J].软件导刊,2012,11(2):137-139. 被引量：6
5张金溪,李永宏,单广荣,李照耀,江静.面向语音合成的藏语单音素与三音素自动切分算法研究[J].计算机应用研究,2013,30(11):3272-3275. 被引量：5
6张怡,胡晓东.苗汉语音节结构对比分析[J].赤峰学院学报（哲学社会科学版）,2014,35(4):196-197. 被引量：1
7易雪蓉,黄巍,胡迪,蒋怡.基于HMM的声调语音模型研究[J].武汉工程大学学报,2018,40(6):691-695. 被引量：2
8卓嘎,边巴旺堆,姜军.双门限算法在藏语语音音节分割中的应用分析[J].科学技术与工程,2015,35(14):196-199. 被引量：3
9李欢欢,王金明,尹海明,徐志军,孔磊,张开礼.一种改进的基于Viterbi的语音切分算法[J].通信技术,2015,48(9):1027-1031. 被引量：4
10陈绍雄,傅美君,胡文君,佘玉梅,潘文林.基于HTK的佤语特定人孤立词语音识别[J].云南民族大学学报（自然科学版）,2017,26(5):417-421. 被引量：4

引证文献2

1张学文,王林,冯夫健,谭棉,李学林.基于卷积神经网络的苗语孤立词语音识别[J].软件导刊,2022,21(2):21-26. 被引量：6
2冯夫健,吴磊,谭棉,蔡姗,张学文,王林.苗语语音音节自适应切分算法[J].科学技术与工程,2024,24(14):5863-5871.

二级引证文献6

1袁子林,张瑞,张彩霞,魏欢,巩海平.民族语言的语音识别研究[J].计算机应用文摘,2024,40(1):81-83.
2陆旭,冉启斌.词向量距离计算反映的当代中文文献中汉语拼音知识图谱[J].语言政策与规划研究,2023(2):30-40.
3蔡姗,郭胜,王林.基于混合密度网络的苗语语音合成方法[J].软件导刊,2024,23(4):31-37.
4冯夫健,吴磊,谭棉,蔡姗,张学文,王林.苗语语音音节自适应切分算法[J].科学技术与工程,2024,24(14):5863-5871.
5蔡姗,王林,谭棉,郭胜,吴磊,王飞.基于子音节表征的苗语语音合成方法[J].科学技术与工程,2024,24(19):8176-8185.
6张莉,张宏伟.融合社会关系的图神经网络民航旅客航班推荐方法[J].微型计算机,2024(8):154-156.

1李阳兵,陈会,罗光杰.贵州不同规模等级坝子空间分布特征研究[J].地理科学,2019,39(11):1830-1840. 被引量：7
2无.以夯实脱贫攻坚为基础探索民族地区农村社区治理新路径[J].乡镇论坛,2020,0(2):15-16.
3仲督.四川省广安市:建立健全容错纠错宽容失误机制[J].党建文汇（上半月）,2019,0(12):23-23.
4代乐.小学英语自然拼读教学优化策略探讨[J].新课程研究,2020,0(11):121-122. 被引量：3
5郭灿文,郇恒飞,马永.利用水平导数与垂向导数标准偏差的相关系数法识别磁源边界[J].地质与勘探,2020,56(2):418-426. 被引量：6
6刘文.升还是平:新寨苗语声调个案研究——兼论平调的感知判断[J].民族语文,2020(1):48-57. 被引量：2
7胡潇飞,刘立斌,倪健.贵州高原型喀斯特森林土壤线虫密度特征[J].亚热带资源与环境学报,2019,14(4):30-35. 被引量：1
8赵亚茹.就英语音素学习看农村初中英语口语教学[J].海外文摘,2020(2):112-114.
9关雪梅.一种基于中值滤波和小波变换的图像去噪处理算法研究[J].中州大学学报,2020,37(1):121-124. 被引量：14
10朱小松.一部文化扶贫的赞歌——大型童声情景合唱《沽若当》给我们的启示[J].词刊,2020,0(3):55-56.

现代信息科技

2020年第3期

浏览历史

内容加载中请稍等...

贵州省中部苗语音素边界检测方法研究被引量：2

参考文献3

二级参考文献15

共引文献9

同被引文献20

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

贵州省中部苗语音素边界检测方法研究 被引量：2

参考文献3

二级参考文献15

共引文献9

同被引文献20

引证文献2

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

贵州省中部苗语音素边界检测方法研究被引量：2