基于中文语义−音韵信息的语音识别文本校对模型被引量：7

Chinese semantic and phonological information-based text proofreading model for speech recognition

下载PDF

导出

摘要为了研究拼音对检测和纠正语音识别文本错误的影响,提出了一种基于中文语义−音韵信息的文本校对模型。定义了5种拼音编码方法构建字符−音韵嵌入向量,以此作为基于GRU的Seq2Seq模型的输入,并应用注意力机制提取语句的语义−音韵信息来校对语音识别文本错误。针对标注语料不足的问题,提出了一种基于拼音声韵置换的数据增强方法。在AISHELL-3公开数据集的实验结果表明,拼音携带的音韵信息有利于校对语音识别文本错误,所提方法可提升模型的检错性能。 To study the influence of Chinese Pinyin on detecting and correcting text errors in speech recognition,a text proofreading model based on Chinese semantic and phonological information was proposed.Five Pinyin coding methods were designed to construct the character-Pinyin embedding vector that was employed as the input of the Seq2Seq model based on gated recurrent unit.At the same time,the attention mechanism was adopted to extract the Chinese semantic and phonological information of sentences to correct speech recognition errors.Aiming at the problem of insufficient labeled corpus,a data augmentation method was introduced,which could automatically obtain annotated corpora by exchanging the initials or finals of Chinese Pinyin.The experimental results on AISHELL-3’s public data show that phonological in-formation is conducive to the text proofreading model to detect and correct text errors after speech recognition,and the proposed data augmentation method can improve the error detection performance of the model.

作者仲美玉吴培良窦燕刘毅孔令富 ZHONG Meiyu;WU Peiliang;DOU Yan;LIU Yi;KONG Lingfu(School of Information Science and Engineering,Yanshan University,Qinhuangdao 066004,China;The Key Laboratory for Computer Virtual Technology and System Integration of Hebei Province,Qinhuangdao 066004,China;The Key Laboratory of Software Engineering of Hebei Province,Qinhuangdao 066004,China)

机构地区燕山大学信息科学与工程学院河北省计算机虚拟技术与系统集成重点实验室河北省软件工程重点实验室

出处《通信学报》 EI CSCD 北大核心 2022年第11期65-79,共15页 Journal on Communications

基金国家重点研发计划基金资助项目(No.2018YFB1308300) 国家自然科学基金资助项目(No.62276028,No.U20A20167) 北京市自然科学基金资助项目(No.4202026) 河北省自然科学基金资助项目(No.F202103079) 河北省创新能力提升计划基金资助项目(No.22567626H) 河北省软件工程重点实验室基金资助项目(No.22567637H)。

关键词文本校对语音识别拼音注意力机制 text proofreading speech recognition Pinyin attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1王辰成,杨麟儿,王莹莹,杜永萍,杨尔弘.基于Transformer增强架构的中文语法纠错方法[J].中文信息学报,2020(6):106-114. 被引量：27
2段建勇,袁阳,王昊.基于Transformer局部信息及语法增强架构的中文拼写纠错方法[J].北京大学学报（自然科学版）,2021,57(1):61-67. 被引量：11
3冯海林,张潇,刘同存.融合评论文本特征和评分图卷积表示的推荐模型[J].通信学报,2022,43(3):164-171. 被引量：3
4张煜,吕锡香,邹宇聪,李一戈.基于生成对抗网络的文本序列数据集脱敏[J].网络与信息安全学报,2020,6(4):109-119. 被引量：6
5叶俊民,罗达雄,陈曙.基于层次化修正框架的文本纠错模型[J].电子学报,2021,49(2):401-407. 被引量：8
6郭可翔,王衡军,白祉旭.融合多通道CNN与BiGRU的字词级文本错误检测模型[J].计算机工程,2022,48(9):63-70. 被引量：4

二级参考文献22

1王辰成,杨麟儿,王莹莹,杜永萍,杨尔弘.基于Transformer增强架构的中文语法纠错方法[J].中文信息学报,2020(6):106-114. 被引量：27
2易蓉湘,何克抗.计算机汉语文稿校对系统[J].计算机研究与发展,1997,34(5):346-350. 被引量：12
3刘挺,施洪滨,邵艳秋.中文计算机辅助校对系统原理[J].中文信息,1997,14(2):21-22. 被引量：6
4王洁.计算机识别汉语语法偏误的可行性分析[J].语言文字应用,2011(1):135-142. 被引量：4
5张仰森,唐安杰,张泽伟.面向政治新闻领域的中文文本校对方法研究[J].中文信息学报,2014,28(6):79-84. 被引量：12
6刘亮亮,曹存根.中文“非多字词错误”自动校对方法研究[J].计算机科学,2016,43(10):200-205. 被引量：15
7张仰森,郑佳.中文文本语义错误侦测方法研究[J].计算机学报,2017,40(4):911-924. 被引量：20
8谭咏梅,杨一枭,杨林,刘姝雯.基于LSTM和N-gram的ESL文章的语法错误自动纠正方法[J].中文信息学报,2018,32(6):19-27. 被引量：8
9宋蕾,马春光,段广晗.机器学习安全及隐私保护研究进展.[J].网络与信息安全学报,2018,4(8):1-11. 被引量：26
10张应成,杨洋,蒋瑞,全兵,张利君,任晓雷.基于BiLSTM-CRF的商情实体识别模型[J].计算机工程,2019,45(5):308-314. 被引量：39

共引文献46

1袁梦真,许潇,张彦豪.基于人工智能的非结构化数据脱敏方法研究[J].网络安全与数据治理,2023,42(S01):184-190.
2张生盛,庞桂娜,杨麟儿,王辰成,杜永萍,杨尔弘,黄雅平.面向汉语作为第二语言学习的个性化语法纠错[J].中文信息学报,2021,35(12):28-35. 被引量：3
3王子斌,张全,谢聪,余沛,余泓江,李沣庭.基于知识图谱与BERT的安全领域汉字文本纠错模型[J].计算机应用,2023,43(S01):75-80.
4张梅,纪天啸.面向深度学习的高质量纠错语料库自动生成方法研究[J].北方工业大学学报,2024,36(2):127-132.
5段建勇,袁阳,王昊.基于Transformer局部信息及语法增强架构的中文拼写纠错方法[J].北京大学学报（自然科学版）,2021,57(1):61-67. 被引量：11
6郭琰,张矛.基于深度学习的语法纠错算法建模研究[J].信息技术,2021,45(4):148-152. 被引量：7
7陈杰,张浩天,汤奕.基于改进生成式对抗网络的电网异常数据辨识方法[J].电力建设,2021,42(5):9-15. 被引量：18
8孙劭芃,汪颢懿,左敏,张青川.基于深度学习的食品安全领域实体关系抽取研究[J].中国酿造,2021,40(7):231-236. 被引量：1
9王正龙,张保稳.生成对抗网络研究综述[J].网络与信息安全学报,2021,7(4):68-85. 被引量：12
10赵国红.中文语法纠错方法的研究综述[J].现代计算机,2021,27(28):65-69. 被引量：5

同被引文献64

1王辰成,杨麟儿,王莹莹,杜永萍,杨尔弘.基于Transformer增强架构的中文语法纠错方法[J].中文信息学报,2020(6):106-114. 被引量：27
2王晓华,要鹏超,马丽萍,王文杰,张蕾.车间环境下机器人语音控制的特征提取算法[J].西安电子科技大学学报,2020,47(2):16-22. 被引量：4
3智娜,李爱军.基于可视化发音模型的语音训练研究[J].外国语,2020,43(1):59-74. 被引量：11
4蒋沅,公成龙,吕科,代冀阳.基于自适应模糊补偿的不确定性机器人CNF控制[J].振动与冲击,2020,39(8):106-111. 被引量：10
5顾迎捷,桂小林,李德福,沈毅,廖东.基于神经网络的机器阅读理解综述[J].软件学报,2020,31(7):2095-2126. 被引量：39
6张玉琢,郑世珏,潘磊.基于语音控制的四自由度轨迹规划书写机器人系统[J].计算机应用,2020,40(S01):284-288. 被引量：10
7黄改娟,王匆匆,张仰森.基于动态文本窗口和权重动态分配的中文文本纠错方法[J].郑州大学学报（理学版）,2020,52(3):9-14. 被引量：10
8杨德举,马良荔,谭琳珊,裴晶晶.基于门控卷积网络与CTC的端到端语音识别[J].计算机工程与设计,2020,41(9):2650-2654. 被引量：14
9王林军,史宝周,张东,丁仕豪,刘建明.基于GA优化的LQR控制对并联机器人的控制研究[J].振动与冲击,2020,39(20):82-90. 被引量：3
10贺文人,刘霞,任磊.工业机器人遥操作系统的空间映射与控制策略[J].计算机应用研究,2020,37(11):3246-3249. 被引量：6

引证文献7

1孙哲,禹可,吴晓非.基于文本序列错误概率和中文拼写错误概率融合的汉语纠错算法[J].计算机应用研究,2023,40(8):2292-2297.
2范雪扬.基于语音识别技术的在线语言交互学习系统的设计与实现[J].自动化与仪器仪表,2023(7):187-190. 被引量：4
3邓伟,官恺,史玉龙,刘桐铭,袁海军.深度学习计算卡性能研究[J].今日制造与升级,2023(7):103-107.
4余波,张立为.基于智能家居语音识别多样化结果的意图分类方法[J].数字技术与应用,2023,41(11):137-139. 被引量：1
5李可.基于Bi-LSTM和Softmax的辅助发声训练系统设计研究[J].自动化与仪器仪表,2024(4):197-200.
6杨维,秦波涛.基于智能语音的翻译机器人自动化控制系统设计[J].计算机测量与控制,2024,32(5):102-108. 被引量：2
7杨艺西,武志栋,袁洲,陈思平,何宇泽.改进遗传算法的电子会议汉语语音识别方法[J].电子设计工程,2024,32(18):132-135.

二级引证文献7

1王晓康.基于语音情感识别的智能照明控制系统的研究[J].电声技术,2024,48(2):7-9. 被引量：2
2程雅琼,赵治斌,冯黎.基于深度学习的学生课程学习状态智能分类方法[J].无线互联科技,2024,21(10):69-71.
3陈华舒,卢振利,王伟栋.具身智文本内容生成的咖啡机器人系统设计[J].高技术通讯,2024,34(6):651-658.
4漆燕彬,任英华,侯艺萱.语音识别技术在音频新闻中的应用与优化[J].电声技术,2024,48(7):68-71.
5徐云鹍,吴雪妍.基于机器视觉的变电站巡检机器人自动导航系统设计[J].通信电源技术,2024,41(18):16-18.
6王亚欣,张蓓蓓.基于AI的电力智能调度语音识别交互系统设计[J].通信电源技术,2024,41(18):73-75.
7王洪波.轮式移动巡检机器人自动化控制系统研究[J].信息与电脑,2024,36(15):107-109.

1周原.基于自然语言处理的纠错系统架构设计[J].太原师范学院学报（自然科学版）,2022,21(3):37-41. 被引量：3
2杨冰.基于深度学习的英语短语译文智能校对系统[J].自动化与仪器仪表,2022(8):185-188. 被引量：1
3小妖.也谈樟茶鸭与漳茶鸭[J].四川烹饪,2022(9):62-63.
4家祺,小路(图).品质和功能都能满足 AURALiC ALTAIR G1.1一体机[J].视听前线,2022(11):27-30.
5袁婉怡.《本草纲目》引《释名》声训研究[J].汉字文化,2022(21):18-22. 被引量：1
6尤微,陆学松.考据式批评与春秋笔法焦循戏曲批评方法摭论[J].中国戏剧,2022(10):74-76.

通信学报

2022年第11期

浏览历史

内容加载中请稍等...

基于中文语义−音韵信息的语音识别文本校对模型被引量：7

参考文献6

二级参考文献22

共引文献46

同被引文献64

引证文献7

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于中文语义−音韵信息的语音识别文本校对模型 被引量：7

参考文献6

二级参考文献22

共引文献46

同被引文献64

引证文献7

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于中文语义−音韵信息的语音识别文本校对模型被引量：7