音乐情感识别研究在音乐智能推荐和音乐可视化等领域有着广阔的应用前景.针对该研究中存在的仅利用低层音频特征进行情感识别时效果有限且可解释性差的问题,首先,构建能够学习音符语义信息的基于乐器数字接口(MIDI)数据的情感识别模型ER...音乐情感识别研究在音乐智能推荐和音乐可视化等领域有着广阔的应用前景.针对该研究中存在的仅利用低层音频特征进行情感识别时效果有限且可解释性差的问题,首先,构建能够学习音符语义信息的基于乐器数字接口(MIDI)数据的情感识别模型ERMSLM(emotion recognition model based on skip-gram and LSTM using MIDI data),该模型的特征是由基于跳字模型(skip-gram)和长短期记忆(LSTM)网络提取的旋律特征,利用预训练的多层感知机(MLP)提取的调性特征以及手动构建的特征3部分连接而成;其次,构建融合歌词和社交标签的基于文本数据的情感识别模型ERMBT(emotion recognition model based on BERT using text data),其中歌词特征是由基于BERT(bidirectional encoder representations from trans formers)提取的情感特征、利用英文单词情感标准(ANEW)列表所构建的情感词典特征以及歌词的词频—逆文本频率(TF-IDF)特征所组成;最后,围绕MIDI和文本两种数据构建特征级融合和决策级融合两种多模态融合模型.实验结果表明,ERMSLM和ERMBT模型分别可达到56.93%,72.62%的准确率,决策级多模态融合模型效果更优.展开更多
为避免音乐信号中干扰信号造成的影响,实现更准确的和弦识别,提出一种基于干扰信号剔除的全频段音乐和弦识别方法,对全频段音乐信号进行采集,利用自适应频移滤波器剔除音乐信号中的干扰信号后,通过傅里叶变换和音阶映射提取干扰信号的...为避免音乐信号中干扰信号造成的影响,实现更准确的和弦识别,提出一种基于干扰信号剔除的全频段音乐和弦识别方法,对全频段音乐信号进行采集,利用自适应频移滤波器剔除音乐信号中的干扰信号后,通过傅里叶变换和音阶映射提取干扰信号的全频段音乐信号PCP(Pitch Class Profles)特征,构建和弦PCP特征模板库,并通过稀疏表示分类器表征提取的待识别的全频段音乐信号PCP特征与和弦PCP特征模板库之间的线性关系,实现全频段音乐和弦识别。通过实验验证,该方法能够实现一种较为精准的全频段音乐和弦识别,对于不同和弦识别率均较高,均能保证在95%以上,且平均识别时间较短,能够保证在3ms之内。展开更多
文摘目的 分析音乐疗法对老年性聋患者负面情绪、言语识别能力的影响。方法 纳入2021年1月~2023年3月我院接纳的老年性聋患者80例,随机分为对照组(40例,言语识别能力训练)与音乐组(40例,言语识别能力训练+音乐疗法),训练前后比较两组患者听觉功能、负面情绪、认知功能及生活质量。结果 训练后音乐组平均听阈、老年听力障碍筛查量表(hearing handicap inventory for the elderly-screening,HHIE-S)评分显著低于对照组(P<0.05);音乐组焦虑自评量表(self-rating anxiety scale,SAS)、抑郁自评量表(self-rating depression scale,SDS)评分显著低于对照组(P<0.05);音乐组简易精神状态评价量表(mini-mentalstateexamination,MMSE)、蒙特利尔认知评估量表(montrealcognitive assessment,MoCA)评分显著高于对照组(P<0.05);音乐组生活质量综合评定问卷-74(generic quality of life inventory-74,GQOLI-74)各维度评分(物质、社会、躯体、心理)显著高于对照组(P<0.05)。结论 对老年性聋患者采用音乐疗法可显著改善言语识别能力,减轻患者负面情绪,提高其认知功能及生活质量。
文摘音乐情感识别研究在音乐智能推荐和音乐可视化等领域有着广阔的应用前景.针对该研究中存在的仅利用低层音频特征进行情感识别时效果有限且可解释性差的问题,首先,构建能够学习音符语义信息的基于乐器数字接口(MIDI)数据的情感识别模型ERMSLM(emotion recognition model based on skip-gram and LSTM using MIDI data),该模型的特征是由基于跳字模型(skip-gram)和长短期记忆(LSTM)网络提取的旋律特征,利用预训练的多层感知机(MLP)提取的调性特征以及手动构建的特征3部分连接而成;其次,构建融合歌词和社交标签的基于文本数据的情感识别模型ERMBT(emotion recognition model based on BERT using text data),其中歌词特征是由基于BERT(bidirectional encoder representations from trans formers)提取的情感特征、利用英文单词情感标准(ANEW)列表所构建的情感词典特征以及歌词的词频—逆文本频率(TF-IDF)特征所组成;最后,围绕MIDI和文本两种数据构建特征级融合和决策级融合两种多模态融合模型.实验结果表明,ERMSLM和ERMBT模型分别可达到56.93%,72.62%的准确率,决策级多模态融合模型效果更优.
文摘为避免音乐信号中干扰信号造成的影响,实现更准确的和弦识别,提出一种基于干扰信号剔除的全频段音乐和弦识别方法,对全频段音乐信号进行采集,利用自适应频移滤波器剔除音乐信号中的干扰信号后,通过傅里叶变换和音阶映射提取干扰信号的全频段音乐信号PCP(Pitch Class Profles)特征,构建和弦PCP特征模板库,并通过稀疏表示分类器表征提取的待识别的全频段音乐信号PCP特征与和弦PCP特征模板库之间的线性关系,实现全频段音乐和弦识别。通过实验验证,该方法能够实现一种较为精准的全频段音乐和弦识别,对于不同和弦识别率均较高,均能保证在95%以上,且平均识别时间较短,能够保证在3ms之内。