基于循环神经网络的西班牙语词汇发音预测模型研究

Research on Predictive Model of Spanish Vocabulary Pronunciation Based on Recurrent Neural Network

下载PDF

导出

摘要依据西班牙语词汇和音素的特征以及词汇标音过程的特点,将西班牙语词汇标音过程建模为序列标注任务,提出基于字符嵌入 + 循环神经网络 + 连接时序分类的端到端词汇标音模型。首先利用word2vec框架在自建的西班牙语词库上训练字符嵌入向量,从而形成西班牙语字符的分布式向量编码表示;之后基于循环神经网络和连接时序分类算法构建了西班牙语词汇标音模型,并在自建的发音词典语料上进行了训练与测试。试验结果显示,基于字符嵌入 + 循环神经网络 + 连接时序分类的词汇标音模型可以获得较其他统计模型或是神经网络模型更高的标音准确率,同时较传统标音模型有更简单的标注流程,对数据集的要求也要低得多,可有效实现端到端的西班牙语词汇标音任务。 According to the characteristics of these vocabularies and phonemes and the characteristics of the vocabulary transcription process, the word vocabulary transcription process is modeled as a sequence labeling task, and an end-to-end vocabulary transcription model method based on character embedding + recurrent neural network + connection arrangement classification is proposed. First, this paper uses the word2vec framework to train the character embedding vector on the self-built serial thesaurus to form a distributed encoding representation of the character;then based on the recurrent neural network and the connection classification algorithm, a model called vocabulary transcription is constructed. The test results show that the word transcription model of string embedding + cyclic neural network + connection order classification can use higher transcription accuracy than other statistical models or neural network models. At the same time, it has a simpler labeling process than traditional phonetic models. The requirements of the phonetic transcription should also be reduced, that can effectively realize the end-to-end task called phonetic transcription.

作者赵皎谷马延周黄晓辉

机构地区战略支援部队信息工程大学洛阳校区

出处《计算机科学与应用》 2020年第10期1714-1727,共14页 Computer Science and Application

关键词西班牙语发音词典字音转换循环神经网络 Spanish Pronunciation Prediction Grapheme-to-Phoneme Conversion Recurrent Neural Network

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献3

1唐美丽,胡琼,马廷淮.基于循环神经网络的语音识别研究[J].现代电子技术,2019,42(14):152-156. 被引量：19
2杨丽,吴雨茜,王俊丽,刘义理.循环神经网络研究综述[J].计算机应用,2018,38(A02):1-6. 被引量：376
3方春,孙福振,李彩虹,邢林林.基于深度学习和字符嵌入的细胞穿透肽预测[J].计算机仿真,2019,36(10):353-358. 被引量：2

二级参考文献13

1滕云,贺春林,岳淼.基于神经网络的语音识别研究[J].重庆师范大学学报（自然科学版）,2010,27(4):73-76. 被引量：10
2冯宏伟,薛蕾.基于HMM和新型前馈型神经网络的语音识别研究[J].计算机工程与设计,2010,31(24):5324-5327. 被引量：6
3周华华,董坚.细胞穿膜肽的研究进展与前景展望[J].西部医学,2012,24(7):1410-1411. 被引量：6
4孙春萌,沈雁,涂家生.细胞穿膜肽的研究进展[J].中国药学杂志,2013,48(14):1143-1147. 被引量：9
5朱小燕,王昱,徐伟.基于循环神经网络的语音识别模型[J].计算机学报,2001,24(2):213-218. 被引量：23
6胡政权,曾毓敏,宗原,李梦超.说话人识别中MFCC参数提取的改进[J].计算机工程与应用,2014,50(7):217-220. 被引量：29
7刘豫军,夏聪.深度学习神经网络在语音识别中的应用[J].网络安全技术与应用,2014(12):28-28. 被引量：5
8张剑,屈丹,李真.基于词向量特征的循环神经网络语言模型[J].模式识别与人工智能,2015,28(4):299-305. 被引量：40
9王山海,景新幸,杨海燕.基于深度学习神经网络的孤立词语音识别的研究[J].计算机应用研究,2015,32(8):2289-2291. 被引量：57
10范博,金明姬,黄伟,王启明,高钟镐.细胞穿膜肽在药物递送系统中的研究进展[J].药学学报,2016,51(2):264-271. 被引量：12

共引文献391

1吴煌,杨智成,李梦华.基于长短期记忆神经网络的矿井涌水量预测[J].中国水运（下半月）,2023,23(3):25-27. 被引量：2
2姚晨明,姚磊.基于智能感知与数据决策的疏浚与通航预警系统研发[J].中国水运（下半月）,2022,22(9):35-36. 被引量：1
3孙铭,魏守科,王莹洁,赵金东,袁梅雪.基于小波分解的LSTM水质预测模型[J].计算机系统应用,2020,29(12):55-63. 被引量：11
4许昱旻,郭春.基于移动平均和神经网络的公路隧道运营通风折减率修正研究[J].现代隧道技术,2022,59(S01):121-127. 被引量：2
5秦帅波.中医知识智能诊断系统的研究[J].计算机产品与流通,2020,9(1):142-142.
6柴晋,乔加飞,孙灏,梁占伟,张千.神经网络算法在脱硫系统优化中的应用进展[J].洁净煤技术,2021,27(S02):27-32. 被引量：3
7李治甫,康帅,尹俊红,王楷诚.基于深度学习的框架结构损伤识别研究[J].河南大学学报（自然科学版）,2024,54(1):100-109.
8李昌明.经验模态分解融合深度学习的时间序列预测模型[J].辽宁工程技术大学学报（自然科学版）,2022,41(2):175-183. 被引量：1
9郭小萍,钟道金,李元.基于AMSDAE-BLSTM的工业过程质量预测[J].电子测量技术,2023,46(4):19-24.
10王琪,赵文仓.基于预过滤注意力的Transformer物体检测[J].电子测量技术,2022,45(24):145-152.

1邓博研,程良伦.基于ALBERT的中文命名实体识别方法[J].计算机科学与应用,2020,10(5):883-892. 被引量：6
2王美琴,易敏,关财忠,王茗祎.车牌自动识别系统设计[J].仪器仪表用户,2020,27(10):5-9. 被引量：3
3杨晨,宋晓宁,宋威.SentiBERT:结合情感信息的预训练语言模型[J].计算机科学与探索,2020,14(9):1563-1570. 被引量：10
4胡良平.如何正确运用Z检验——Z检验的基本概念与前提条件[J].四川精神卫生,2020,33(5):418-421. 被引量：1
5陈微.基于教育大数据的智慧图书馆学科资源库建设研究[J].科技传播,2020,12(19):130-132. 被引量：1
6魏艳涛,雷芬,胡美佳,邓伟,姚璜,王志锋.学生表情识别研究综述[J].中国教育信息化,2020,26(21):48-55. 被引量：9
7刘音.基于遗传算法的测试用例集约简研究[J].电子制作,2020,28(21):37-38.
8谢明军,何剑峰,胡小溪,曹源.基于故障日志的城轨地面信号故障诊断[J].北京交通大学学报,2020,44(5):27-35. 被引量：13
9穆凯代姆罕·伊敏江,沙尔旦尔·帕尔哈提,艾斯卡尔·艾木都拉,米吉提·阿不里米提.维-哈-柯多语言词素切分集成环境研究[J].电视技术,2020,44(6):46-51. 被引量：1
10孙小宇,聂振禹,孙烨祥,包蓓艳,林鸿波,张路霞.宁波市鄞州区透析患者30天再入院影响因素分析及简易评分工具构建[J].中国血液净化,2020,19(11):721-725. 被引量：2

计算机科学与应用

2020年第10期

浏览历史

内容加载中请稍等...

基于循环神经网络的西班牙语词汇发音预测模型研究

参考文献3

二级参考文献13

共引文献391

相关作者

相关机构

相关主题

浏览历史