-
题名苗语语音音节自适应切分算法
- 1
-
-
作者
冯夫健
吴磊
谭棉
蔡姗
张学文
王林
-
机构
贵州民族大学数据科学与信息工程学院
贵州省模式识别与智能系统重点实验室
贵阳人文科技学院大数据与信息工程学院
-
出处
《科学技术与工程》
北大核心
2024年第14期5863-5871,共9页
-
基金
贵州省科技计划(黔科合基础-ZK[2022]一般195,黔科合基础-ZK[2023]一般143,黔科合平台人才-ZCKJ[2021]007,黔科合基础-ZK[2024]一般493)
贵州省青年科技人才成长项目(黔教合KY字[2021]104,黔教合KY字[2021]113,黔教合KY字[2021]110)
+1 种基金
贵州省教育厅自然科学研究项目(黔教技[2023]061号,黔教技[2023]012号,黔教技[2022]015号)
贵州省模式识别与智能系统重点实验室开放课题(GZMUKL[2022]KF01)。
-
文摘
语音分割是苗语语音基础研究的难点和热点问题,其本质是苗语语音音节与沉默段(静音、噪音)之间边界模糊问题,目前相关研究成果较少。针对苗语语音音节分割边界模糊问题,以时域特征分割获得初始的语音边界,通过构建语音音节边界优化评价函数模型,将音节与沉默段之间边界模糊问题转化为音节真实边界和算法预测边界的误差极小化问题,以精英策略保留算法最佳优化分割边界种群个体,提取苗语语音音节与沉默段间的精准边界。实验结果表明,所提方法能显著提高苗语语音音节自适应边界搜索能力。此外,所提自适应分割算法在语音分割模糊边界分割方面显著优于典型的语音分割算法。
-
关键词
苗语语音分割
时域特征
苗语语音音节
精英策略
自适应
-
Keywords
hmong speech segmentation
time domain features
hmong phonetic syllable
elite strategy
self-adaptation
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于子音节表征的苗语语音合成方法
- 2
-
-
作者
蔡姗
王林
谭棉
郭胜
吴磊
王飞
-
机构
贵州民族大学数据科学与信息工程学院
贵州省模式识别与智能系统重点实验室
贵州民族大学人文科技学院
-
出处
《科学技术与工程》
北大核心
2024年第19期8176-8185,共10页
-
基金
国家自然科学基金(62162012)
贵州省科技计划(黔科合基础-ZK[2022]一般195,黔科合基础-ZK[2023]一般143,黔科合平台人才-ZCKJ[2021]007)
+4 种基金
贵州省教育厅自然科学研究项目(黔教技[2023]061号,黔教技[2023]012号,黔教技[2022]015号)
贵州省青年科技人才成长项目(黔教合KY字[2021]115,黔教合KY字[2021]110)
贵州省模式识别与智能系统重点实验室开放课题(GZMUKL[2022]KF01,GZMUKL[2022]KF05)
贵州省高层次创新型人才项目(黔科合平台人才-GCC[2023]027)
教育部产学合作协同育人项目(221001766110209)。
-
文摘
少数民族语言的语音合成有助于民族文化的传承、保护和发展,目前相关研究成果较少。针对不同声调的相同词发音相似时易出现语音合成错误的问题,提出了一种基于子音节表征的苗语语音合成方法,该方法利用子音节作为训练基元来表征苗语发音信息,以区分学习不同音节间的相似发音。根据文本序列和梅尔谱图之间对齐的单调性,引入单调对齐损失来指导注意力模块进行更准确的对齐学习,以减少因注意力机制的自回归性带来的跳词、重复等合成现象。为验证所提方法的有效性,以自建苗语语音合成语料库HmongSpeech(下载链接:http://sxjxsf.gzmu.edu.cn/info/1728/1214.htm)作为基准数据集,与典型的语音合成方法进行对比实验。实验结果表明,所提方法能够降低不同声调的相同词发音相似时导致的合成错误率,词错误率仅为0.96%,较基线方法改善了6.25%。
-
关键词
苗语语音合成
子音节
单调对齐
语料库
梅尔谱图
-
Keywords
Hmong language text-to-speech
sub-syllable
monotonic alignment
corpus
Mel-spectrogram
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名谈用汉字记录苗语语音的几个问题
- 3
-
-
作者
龙云清
-
机构
铜仁学院黔东文化研究中心
-
出处
《铜仁学院学报》
2008年第5期57-59,74,共4页
-
文摘
用汉字记录苗语语音,有悠久的历史。这种方式对汉语来说,一方面丰富了汉语的词汇库,另一方面也增加了汉语考证的难度。对于苗语来说,第一,能起到助记和标注作用;第二,由于汉字是表意文字,加之记音的准确率不高,记音词汇往往带来歧义;第三,汉字记音已成为一种习惯,即使积习难改,我们仍然应该追求更加准确的记音方式。
-
关键词
汉字
记录
苗语语音
问题
-
Keywords
Chinese ,characters
record
the pronunciation of the Miao Nationality's Dialect
problem
-
分类号
H07
[语言文字—语言学]
-
-
题名基于卷积神经网络的苗语孤立词语音识别
被引量:6
- 4
-
-
作者
张学文
王林
冯夫健
谭棉
李学林
-
机构
贵州民族大学数据科学与信息工程学院
贵州省模式识别与智能系统重点实验室
-
出处
《软件导刊》
2022年第2期21-26,共6页
-
基金
贵州省科技厅计划项目(黔科合基础[2019]1164号)
贵州省教育厅青年项目(黔教合KY字[2021]104)
+2 种基金
贵州省教育厅青年项目([2018]5773-QN02)
贵州省教育厅创新群体重大研究项目(黔教合KY字[2018]018)
贵州民族大学校级一般项目(GZMU2021YB24)。
-
文摘
苗语作为西南少数民族的主要语种之一,其语音研究存在语言文字缺失、语音语料库不健全、地域差异等问题,因此苗语的语音识别难度较大。针对语音语料库不健全的问题,借助汉语拼音对苗语语音进行标注,构建不同地域的苗语语音语料库。基于拼音媒介传递的思想,设计苗语孤立词汇识别模型,该模型利用卷积神经网络对提取的语音特征进行训练和测试,解决了文字缺失情况下的苗语孤立词语音识别问题。为验证该模型的有效性和稳定性,以自建苗语语音语料库的数据作为实验数据集,分别在同地域、不同地域以及组合地域语音数据集上进行验证实验。实验结果表明,所提模型对苗语孤立词语音识别有效,同地域语音识别效果优于不同地域识别效果,在组合地域语音识别中表现亦良好。
-
关键词
苗语孤立词
苗语语音标注
苗语语音语料库
语音识别
卷积神经网络
-
Keywords
Hmong language isolated words
Hmong language phonetic tagging
Hmong language voice corpus
speech recognition
convolutional neural network
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-