基于双向GRU模型的藏语语音情感识别被引量：1

下载PDF

导出

摘要语音情感识别(speech emotion recognition,SER)是人机交互的重要组成部分,具有着非常广泛的研究和应用价值,可是在藏语语音情感识别领域的研究成果却不多。为了研究藏语SER领域,在构建了一个有着六千条拉萨话方言的藏语情感语音数据库TSED基础上,提出一种以MFCC特征和谱对比度特征相结合的双向GRU情感识别模型,通过对比不同实验的识别效果,用于判断模型的可行性。最后的实验结果表明,所提出的模型在藏语语音情感识别中可以达到87.22%的识别效果。

作者蔡优新边巴旺堆 CAI Youxin;BIANBA Wangdui

机构地区西藏大学信息科学技术学院

出处《信息技术与信息化》 2023年第10期209-213,共5页 Information Technology and Informatization

关键词藏语语音情感识别门控循环单元 Mel频谱图梅尔倒频谱系数多特征融合

分类号 TN912.3 [电子电信—通信与信息系统] H214 [语言文字—少数民族语言]

引文网络
相关文献

参考文献5

1边巴旺堆,王希,王君堡.藏语语音识别研究进展综述[J].高原科学研究,2022,6(4):76-84. 被引量：3
2彭毛扎西,才智杰,才让卓玛.藏语情感语音数据库构建[J].北京大学学报（自然科学版）,2023,59(5):773-781. 被引量：1
3曹欣怡,李鹤,王蔚.基于语料库的语音情感识别的性别差异研究[J].南京大学学报（自然科学版）,2019,55(5):758-764. 被引量：3
4褚钰,李田港,叶硕,叶光明.语音情感识别中的特征选择方法[J].应用声学,2020,39(2):216-222. 被引量：5
5王茂林,郝刚.基于Attention-CGRU网络的中文语音情感识别[J].计算机系统应用,2023,32(1):296-301. 被引量：3

二级参考文献43

1塔什甫拉提·尼扎木丁,梁瑞宇,谢跃,赵力.采用原子表示模型的维吾尔语语音情感识别[J].信号处理,2020,36(1):9-17. 被引量：3
2德庆卓玛.藏语语音识别研究综述[J].西藏大学学报（社会科学版）,2010,25(S1):192-195. 被引量：5
3高慧,苏广川,陈善广.不同情绪状态下汉语语音的声学特征分析[J].航天医学与医学工程,2005,18(5):350-354. 被引量：23
4蒋丹宁,蔡莲红.基于语音声学特征的情感信息识别[J].清华大学学报（自然科学版）,2006,46(1):86-89. 被引量：38
5魏艳,张雪英.噪声条件下的语音特征PLP参数的提取[J].太原理工大学学报,2009,40(3):222-224. 被引量：6
6姚徐,李永宏,单广荣,于洪志.藏语孤立词语音识别系统研究[J].西北民族大学学报（自然科学版）,2009,30(1):29-36. 被引量：10
7韩清华,于洪志.基于HMM的安多藏语非特定人孤立词语音识别研究[J].软件导刊,2010,9(7):173-175. 被引量：9
8李冠宇,孟猛.藏语拉萨话大词表连续语音识别声学模型研究[J].计算机工程,2012,38(5):189-191. 被引量：16
9任鹏辉,张雪英,孙颖.面向语音情感计算的数据库的构建与应用研究[J].电视技术,2012,36(21):89-92. 被引量：3
10韩文静,李海峰.情感语音数据库综述[J].智能计算机与应用,2013,3(1):5-7. 被引量：15

共引文献10

1李晓宇,徐勇,张心蕊,汪倩,武雅利.语音情感识别研究进展分析[J].现代计算机,2020,26(20):44-47.
2吴礼福,徐行.融合韵律与动态倒谱特征的语音疲劳度检测[J].南京大学学报（自然科学版）,2021,57(4):709-714. 被引量：2
3吴情,胡维平,陈丹丹,肖婷.基于深度学习的语声抑郁识别[J].应用声学,2022,41(5):837-842.
4贾宁,郑纯军.融合音频、文本、表情动作的多模态情感识别[J].应用科学学报,2023,41(1):55-70. 被引量：7
5辛逸男,张莉,吴鹏飞,刘欣阳,刘志宽.一种基于语音信号的抑郁症智能诊断方法[J].北京生物医学工程,2023,42(1):38-44. 被引量：2
6吴婧,廖明潮.基于CA-GRU的污水处理厂出水总氮浓度预测研究[J].自动化仪表,2024,45(4):97-100.
7张恒,拉巴顿珠,官政先,肖鑫.基于深度神经网络的藏语语音关键词检索方法[J].西藏科技,2024,46(6):73-80.
8申雁,李鸿燕,蒙志宏,张丽彩.融合双路CNN-LSTM与注意力机制的语音情感识别模型[J].电子设计工程,2024,32(18):6-11.
9王嘉文,高定国,索朗曲珍,尼琼.基于特征提示的跨语种语音识别模型[J].科学技术与工程,2024,24(24):10348-10355.
10方丛丛,金赟,赵力,马勇,李世党,顾煜.基于文本特征能量编码的多模态语声情感识别[J].应用声学,2024,43(5):997-1007.

同被引文献12

1高庆吉,赵志华,徐达,邢志伟.语音情感识别研究综述[J].智能系统学报,2020,15(1):1-13. 被引量：16
2罗德虎,冉启武,杨超,豆旺.语音情感识别研究综述[J].计算机工程与应用,2022,58(21):40-52. 被引量：6
3梁科晋,张海军,刘雅情,张昱,王月阳.混合多尺度卷积结合双层LSTM语音情感识别[J].计算机与现代化,2023(1):63-68. 被引量：1
4崔晨露,崔琳.面向数据增强的轻量化语音情感识别[J].计算机与现代化,2023(4):83-89. 被引量：4
5陶建华,陈俊杰,李永伟.语音情感识别综述[J].信号处理,2023,39(4):571-587. 被引量：5
6崔琳,崔晨露,刘政伟,薛凯.改进MFCC和并行混合模型的语音情感识别[J].计算机科学,2023,50(S01):156-162. 被引量：6
7谷泽月,边巴旺堆,祁晋东.基于多特征融合的藏语语音情感识别[J].现代电子技术,2023,46(21):129-133. 被引量：3
8史少寒,周晓彦,李大鹏.基于ARIMA算法特征补齐的语音情感识别[J].电子器件,2023,46(5):1333-1338. 被引量：4
9孙颖,李泽,张雪英.基于约束式双通道模型的语音情感识别[J].东北大学学报（自然科学版）,2023,44(11):1537-1542. 被引量：1
10张晓莉.改进MFCC特征和MLA模型的语音情感识别[J].福建电脑,2024,40(1):52-56. 被引量：3

引证文献1

1董胡,彭高丰,李垣陵.中文儿童语音情感识别研究综述[J].特立研究,2024(2):16-21.

1向志昊,魏华.基于声纹特征识别的电力变压器运维检测技术研究[J].电子设计工程,2023,31(20):114-118. 被引量：8
2张成,石磊,赵慧然.维度语音情感识别研究综述[J].科技资讯,2023,21(10):253-256.
3彭毛扎西,才智杰,才让卓玛.藏语情感语音数据库构建[J].北京大学学报（自然科学版）,2023,59(5):773-781. 被引量：1
4张乐,宁静华,张鑫,王振,刘虹汝,张钰哲.综合分析和鉴定m^(6)A RNA甲基化调节因子对前列腺癌进展及预后的影响[J].中国医科大学学报,2023,52(11):971-978.
5梁冰,朱海涛,余洋,黄斯凯,扈海泽.基于LK-means算法的绝缘子冰闪放电的声发射信号检测技术研究[J].电力学报,2023,38(5):374-381.
6付孟新,郭世伟,王泽兴,丁建明.基于一维卷积神经网络的列车异响识别系统研究[J].电子测量技术,2023,46(14):9-17. 被引量：2
7班玉莹,成功.基于GF-2影像的离子吸附型稀土矿含量推断方法[J].地质学刊,2023,47(3):291-296.
8肖瑾,吴澎泞,王科凯,周彦妮,杨焱麟,何力,陈敏.痛泻要方拆方对IBS-D大鼠肠道通透性影响的功能研究[J].时珍国医国药,2023,34(8):1817-1820. 被引量：2
9闻胜月,庞坚,张旻,林勋,曹月龙,陈博,詹红生.石氏熏洗方药浴对膝骨关节炎兔模型软骨细胞凋亡的影响[J].时珍国医国药,2023,34(8):1841-1844.
10Jiong-hua Huang,Chuang-jia Huang,Li-na Yu,Xiao-ling Guan,Shang-wen Liang,Jian-hong Li,Lu Liang,Min-yan Wei,Ling-min Zhang.Bioinspired PROTAC-induced macrophage fate determination alleviates atherosclerosis[J].Acta Pharmacologica Sinica,2023,44(10):1962-1976. 被引量：1

信息技术与信息化

2023年第10期

浏览历史

内容加载中请稍等...

基于双向GRU模型的藏语语音情感识别被引量：1

参考文献5

二级参考文献43

共引文献10

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于双向GRU模型的藏语语音情感识别 被引量：1

参考文献5

二级参考文献43

共引文献10

同被引文献12

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于双向GRU模型的藏语语音情感识别被引量：1