-
题名融合音素的缅甸语语音识别文本纠错
- 1
-
-
作者
陈璐
董凌
王文君
王剑
余正涛
高盛祥
-
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2024年第6期1121-1127,共7页
-
基金
国家自然科学基金(U21B2027,61972186)
云南高新技术产业发展项目(201606)
+2 种基金
云南省重大科技专项计划(202103AA080015,202302AD080003)
云南省基础研究计划(202001AS070014)
云南省学术和技术带头人后备人才(202105AC160018)。
-
文摘
缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法。通过参数共享策略对转录文本及其音素进行联合建模,利用音素信息辅助检测并纠正缅甸语同音和空格错误。实验结果表明,本文所提方法相比基线方法ConvSeq2Seq,在缅甸语语音识别纠错任务中的F1值提升了85.97%,达到了79.15%。
-
关键词
缅甸语
语音识别文本纠错
音素
共享参数
BERT
-
Keywords
Burmese language
speech recognition text correction
phoneme
shared parameter
bidirectional encoder representations from transformers(BERT)
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-