期刊文献+
共找到136篇文章
< 1 2 7 >
每页显示 20 50 100
新形势下国家重点实验室重组的差异分析与经验总结——以学科、企业、省部共建三类全国重点实验室为例
1
作者 姜涵 俞逸洋 +2 位作者 余强 赵海兴 邹国斌 《实验技术与管理》 CAS 北大核心 2024年第11期226-234,共9页
为了应对新形势下科技发展需求,国家正在重组优化实验室体系。该文首先从科技发展的五项关键要求(强化基础研究、促进产学研融合、培育创新人才、增强国际竞争力和服务国家战略)剖析了国家实验室体系的重要性,同时指出目前实验室体系存... 为了应对新形势下科技发展需求,国家正在重组优化实验室体系。该文首先从科技发展的五项关键要求(强化基础研究、促进产学研融合、培育创新人才、增强国际竞争力和服务国家战略)剖析了国家实验室体系的重要性,同时指出目前实验室体系存在学科滞后、创新不足、定位模糊、人才培养挑战及国际影响力待提升等问题。然后借鉴成功案例,强调了实验室明确定位、加强人才培养与平台建设、促进产学研合作的重要性。最后,通过分析学科、企业、省部共建三类实验室重组案例,旨在为正在重组的国家重点实验室提供借鉴,推动整体体系升级与发展。 展开更多
关键词 国家重点实验室重组 科技发展要求 战略科技力量 产学研合作
下载PDF
面向藏文信息处理的藏语短语分类体系研究
2
作者 才藏太 索南才让 《青海民族大学学报(藏文版)》 CSSCI 2023年第3期99-110,共12页
藏语短语分类体系研究是藏语语言信息处理的重要组成部分,是关键的技术难题。该项技术研究将直接运用于藏文通用大型语料库的建设,在藏文文字识别、自动分词、自动校对、信息检索、文本分类、机器翻译等方面有重要的应用价值,是未来藏... 藏语短语分类体系研究是藏语语言信息处理的重要组成部分,是关键的技术难题。该项技术研究将直接运用于藏文通用大型语料库的建设,在藏文文字识别、自动分词、自动校对、信息检索、文本分类、机器翻译等方面有重要的应用价值,是未来藏文信息传播、交换、藏语智能化研究的动力和基础。藏语短语是藏语语法的一个重要特征和主要内容,藏语短语也像其它语言一样具有一定的语法规则,由实词和虚词搭配而成。藏语短语中词与词的关系、词与虚词的关系是藏语短语研究的重点,也是藏语短语结构中值得关注的研究方向之一。藏语短语分类体系的研究是自然语言处理的基础性任务之一,是近年来研究者持续关注的重要研究课题。该文在从大型藏语语料库中抽取大量的藏语短语的基础上,对其内部结构、语法功能等进行深入的分析,参考语言学文献中藏语短语的分类体系,遵循计算机便于自动分析和处理的原则对藏语短语进行了分类,并规定了信息处理中藏语短语类别单位的标记代码。 展开更多
关键词 藏文信息 短语 分类
下载PDF
《多语种智能信息处理专题》卷首语
3
作者 赵小兵 孙媛 李琳 《中国科学数据(中英文网络版)》 CSCD 2022年第2期1-1,共1页
多语种智能信息处理是人工智能发展的前沿方向和关键要点。为了更好地服务于国家“一带一路”倡议发展规划,中国人工智能学会成立了多语种智能信息处理专业委员会,旨在实现语言相通、信息相通,为“一带一路”上各国家各民族的经贸相通... 多语种智能信息处理是人工智能发展的前沿方向和关键要点。为了更好地服务于国家“一带一路”倡议发展规划,中国人工智能学会成立了多语种智能信息处理专业委员会,旨在实现语言相通、信息相通,为“一带一路”上各国家各民族的经贸相通、文化相通与民心相通贡献力量。其中,多语种数据共享与评测是多语种智能信息处理的基础保障。 展开更多
关键词 智能信息处理 多语种 数据共享 人工智能 卷首语 一带一路 民心相通 前沿方向
下载PDF
T-Transformer-XL和T-XLNet:两个藏语预训练模型
4
作者 贾星星 陆玉 +2 位作者 杨龙飞 多拉 王道顺 《西安邮电大学学报》 2024年第4期93-99,共7页
针对藏文在语料资源相对有限、可用于训练的预训练模型较为稀缺的问题,建立两个具有强编码能力的预训练模型:T-Transformer-XL和T-XLNet,并在自建大型藏语数据集T-News上分别进行训练。根据藏文文字的特殊结构,利用Sentence Piece分词... 针对藏文在语料资源相对有限、可用于训练的预训练模型较为稀缺的问题,建立两个具有强编码能力的预训练模型:T-Transformer-XL和T-XLNet,并在自建大型藏语数据集T-News上分别进行训练。根据藏文文字的特殊结构,利用Sentence Piece分词模型中的字节对编码对藏文数据进行分词处理,并调整分词策略和目标函数解决不同算力和不同应用场景下的藏文生成问题。对T-Transformer-XL模型进行循环机制匹配和相对位置编码匹配,以有效建模长文本的上下文特征,对T-XLNet模型进行排列语言建模匹配,采用两种状态的自注意力机制提取文本特征。最后,通过基于自监督流形基数据增强方法,利用掩码语言模型生成逼真的增强样本,以丰富预训练模型的输出文本。实验结果表明,T-Transformer-XL和T-XLNet在文本生成任务中表现出色,可以根据具体的任务需求、可用的计算资源及模型性能的要求合理选择具体模型,实现最佳的应用效果。 展开更多
关键词 藏文 自然语言处理:深度神经网络 文本生成 数据增强
下载PDF
融合多尺度特征与上下文信息的语音增强方法
5
作者 更藏措毛 黄鹤鸣 杨毅杰 《计算机工程》 CAS CSCD 北大核心 2024年第6期138-147,共10页
在语音增强中,常用自编码器结构自动提取特征,但这样得到的特征单一或者冗余且不能较好地捕获语音信号的上下文依赖关系。因此,提出一种融合多尺度特征和上下文信息的语音增强方法MSF-CI。首先,利用多尺度卷积块提取语音信号的多尺度特... 在语音增强中,常用自编码器结构自动提取特征,但这样得到的特征单一或者冗余且不能较好地捕获语音信号的上下文依赖关系。因此,提出一种融合多尺度特征和上下文信息的语音增强方法MSF-CI。首先,利用多尺度卷积块提取语音信号的多尺度特征,解决特征单一问题;其次,利用注意力机制关注所提取特征的空间与通道关键信息,解决特征冗余问题;最后,使用门控卷积循环神经网络学习语音信号中跨度较长的上下文依赖关系,并通过门控线性单元提高该网络的非线性学习能力,从而提高模型的泛化性。实验结果表明,MSF-CI在低信噪比和不同噪声环境下增强语音信号的语音感知质量、短时客观可懂度等多个指标上均优于GRN、DPT-FSNet、U-Net等同类的单通道语音增强模型。在信噪比为0 dB时,该方法的平均语音感知质量和平均语音客观可懂度达到1.49和0.761。在构建的安多藏语语料库上验证模型的泛化性,平均语音感知质量和平均语音客观可懂度相对于噪声提高了20.7%和11.3%,MSF-CI模型不仅可以提升语音的质量与可理解度,而且具有较优的泛化性。 展开更多
关键词 语音增强 多尺度特征 注意力机制 门控卷积循环神经网络 对数能量谱
下载PDF
模糊超图相似性测度及其在决策中的应用
6
作者 党明聪 耿生玲 《计算机仿真》 2024年第2期373-379,429,共8页
相似性度量在模糊环境中起着重要作用。通过距离测度进行相似性判断的方法通常利用两个模糊系统间的欧几里得距离,明科夫斯基距离和曼哈顿距离进行测度。引入一种新的基于欧几里得距离求解模糊集距离相似性测度的方法,通过分析将此方法... 相似性度量在模糊环境中起着重要作用。通过距离测度进行相似性判断的方法通常利用两个模糊系统间的欧几里得距离,明科夫斯基距离和曼哈顿距离进行测度。引入一种新的基于欧几里得距离求解模糊集距离相似性测度的方法,通过分析将此方法推广至模糊超图。并提出了三种与模糊集和模糊超图相关的算法。使用此算法可以应对不同类型的决策分析。为了检验上述方法的效率与可靠性,利用多个实例进行验证,证明了所提出新的距离相似性测度方法的合理性和有效性。 展开更多
关键词 相似性 模糊集 模糊超图 距离相似性测度 拟合函数
下载PDF
基于藏文音节结合BiLSTM-CRF的藏语语义组块分类标注
7
作者 旦正吉 华却才让 +1 位作者 完么措 白颖 《高原科学研究》 CSCD 2024年第2期118-125,共8页
针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLST... 针对藏语句子语义分析中语义种类繁多且广泛存在歧义的难点,提出了基于藏文音节向量和BiL-STM-CRF混合模型相结合的藏语语义组块识别方法。首先制定了13种语义组块标注规范,其次构建了13211句语义组块标注语料库,在此基础上采用TS-BiLSTM-CRF方法训练了藏语语义组块识别和分类模型。综合测试实验结果表明,该模型精确率为75.03%,召回率为76.52%,F1值为75.77%。各类语义组块识别中,指示类(INS)识别的测评结果远高于其他几类语义组块,精确率为90.87%;组织类(ORG)的测评结果偏低于其他类型,精确率为66.67%。文章研究证实了TS-BiLSTM-CRF模型在藏语语义组块识别分析任务中具有较好的性能。 展开更多
关键词 藏语 语义组块识别 TS-BiLSTM-CRF模型 标注规范
下载PDF
一种基于WaveNet的藏语语音合成方法 被引量:4
8
作者 丁云涛 才让卓玛 +1 位作者 贡保加 才智杰 《计算机仿真》 北大核心 2023年第1期295-299,538,共6页
针对Griffin-Lim声码器合成语音保真度低、人工合成痕迹明显的问题,提出了一种基于WaveNet神经网络声码器的藏语语音合成方法。方法基于藏文文本特征及藏语Mel频谱,运用WaveNet的相位恢复能力实现了藏语的语音合成。先将藏文文本经字符... 针对Griffin-Lim声码器合成语音保真度低、人工合成痕迹明显的问题,提出了一种基于WaveNet神经网络声码器的藏语语音合成方法。方法基于藏文文本特征及藏语Mel频谱,运用WaveNet的相位恢复能力实现了藏语的语音合成。先将藏文文本经字符编码转换为相应词向量,并通过卷积运算和注意力权重赋值完成文本特征提取;利用非线性变换和线性投影预测Mel频谱;利用WaveNet声码器合成藏语语音波形。实验数据表明,相对于Griffin-Lim算法合成的语音,所提方法所合成的语音效果更好。 展开更多
关键词 藏语语音合成 梅尔频谱 神经网络声码器
下载PDF
区块链智能合约技术研究综述 被引量:5
9
作者 汪永菊 杜秀娟 陈浩章 《计算机仿真》 北大核心 2023年第8期1-4,65,共5页
区块链包含去中心化、不可篡改等特性,是一种将密码学技术、共识机制和智能合约等技术集成一体并由多方参与者进行管理和维护的分布式账本数据。将区块链和智能合约技术进行结合,智能合约获得了一个新的定义。首先简要概述了区块链,其... 区块链包含去中心化、不可篡改等特性,是一种将密码学技术、共识机制和智能合约等技术集成一体并由多方参与者进行管理和维护的分布式账本数据。将区块链和智能合约技术进行结合,智能合约获得了一个新的定义。首先简要概述了区块链,其次介绍智能合约;然后分别从比特币脚本、以太坊平台、超级账本三方面阐述智能合约的主要开发平台并进行对比分析;进一步从金融、医疗、物联网和供应链管理等四个典型领域阐述智能合约的应用场景,最后对文中内容进行总结和展望。 展开更多
关键词 区块链 智能合约 比特币脚本 以太坊 超级账本
下载PDF
藏语情感语音数据库构建 被引量:1
10
作者 彭毛扎西 才智杰 才让卓玛 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第5期773-781,共9页
针对目前藏语语音情感类型划分不够细致,语音情感分析数据库规模较小的问题,在分析汉、英等语言语音情感类型划分方案及数据库基础上,提出一种藏语情感语音数据库构建方案,包括藏语语音情感分类、情感语音采集、情感语音标注以及有效性... 针对目前藏语语音情感类型划分不够细致,语音情感分析数据库规模较小的问题,在分析汉、英等语言语音情感类型划分方案及数据库基础上,提出一种藏语情感语音数据库构建方案,包括藏语语音情感分类、情感语音采集、情感语音标注以及有效性分析等。根据此方案,建立面向藏语语音情感分析的情感类型集(TESCS-9),用录音法和剪辑法采集2786句藏语情感语音,并对其进行标注,利用改进的模糊综合评价法评估情感语音得到含2745句藏语情感语音数据库(TESDB-2745),为藏语语音情感分析奠定了基础。 展开更多
关键词 语音信号处理 藏语 情感语音 数据库
下载PDF
融合La格虚词语义信息的藏文La格分类模型
11
作者 班玛宝 慈祯嘉措 +1 位作者 张瑞 才让加 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期695-703,共9页
采用深度学习方法实现藏文La格(■)分类是一项具有挑战性和重要研究意义的藏语自然语言处理任务.藏文La格的自动分类更加依赖于上下文语义信息和特征的时序性,该文通过分析La格虚词的用法及语义特征,在设计La格虚词语义信息标记算法的... 采用深度学习方法实现藏文La格(■)分类是一项具有挑战性和重要研究意义的藏语自然语言处理任务.藏文La格的自动分类更加依赖于上下文语义信息和特征的时序性,该文通过分析La格虚词的用法及语义特征,在设计La格虚词语义信息标记算法的基础上,提出一种融合La格虚词语义信息的藏文La格分类模型.该模型首先以每个音节及对应La格虚词或其它音节的语义特征嵌入作为输入,丰富嵌入向量的语义信息,增加输入特征的多样性;然后采用一维卷积融合并学习每个音节及对应La格虚词或其它音节语义信息的局部特征向量,提高卷积层的空间特征学习能力;其次使用双向长短时记忆网络(long short-term memory)(LSTM)学习时序特征,提高时序特征的学习能力;最后使用注意力机制对双向LSTM层每一时刻的输出特征进行加权融合,充分利用每一时刻的输出特征,以提高最终文本表示的特征质量.在TLD藏文La格数据集上的实验结果显示,该模型的分类效果优于基线模型及仅用藏文音节嵌入的模型,在测试集上的分类准确率为93.10%. 展开更多
关键词 自然语言处理 La格虚词 语义信息 神经网络 La格分类
下载PDF
调和犹豫模糊偏好关系及其在群决策中的应用
12
作者 冯雪 耿生玲 《重庆理工大学学报(自然科学)》 北大核心 2023年第11期134-146,共13页
基于犹豫模糊环境和概率犹豫模糊环境,在实际的群决策过程中普遍存在计算复杂繁琐和与数量运算规则不相容等问题。对于已有理论的缺陷,提出了调和犹豫模糊偏好关系和乘性一致的调和犹豫模糊偏好关系的定义。调和犹豫模糊偏好关系具有编... 基于犹豫模糊环境和概率犹豫模糊环境,在实际的群决策过程中普遍存在计算复杂繁琐和与数量运算规则不相容等问题。对于已有理论的缺陷,提出了调和犹豫模糊偏好关系和乘性一致的调和犹豫模糊偏好关系的定义。调和犹豫模糊偏好关系具有编程简单、易于实现、计算量小且运算相容等特点,这使其在具体应用中的操作过程大大简化。此外,给出了调和犹豫模糊偏好关系的一致性水平的判定及调整算法,可以检测和提高乘性一致性水平。最后,构建基于调和犹豫模糊偏好关系的群决策方法,并将其应用于紧急预案如火灾现场救援决策选择问题。 展开更多
关键词 调和犹豫模糊偏好关系 乘性一致性 一致性指数 判定条件 群体决策
下载PDF
藏语动词语义角色的定义及标注标记集
13
作者 完么扎西 嘎玛扎西 头旦才让 《高原科学研究》 CSCD 2023年第4期86-94,共9页
语义角色的研究是实现浅层语义分析的基础,其对自然语言的语义理解和分析有着重要的作用,定义一个具体且清晰的语义角色分类体系来解释句子成分的语义显得至关重要,它能够促进语义角色数据集的建立以及相关语义分析模型的研究。文章在... 语义角色的研究是实现浅层语义分析的基础,其对自然语言的语义理解和分析有着重要的作用,定义一个具体且清晰的语义角色分类体系来解释句子成分的语义显得至关重要,它能够促进语义角色数据集的建立以及相关语义分析模型的研究。文章在已有研究基础上,根据动词的及物不及物、自主非自主和自动他动等范畴,对藏语谓词论元结构进行了详细探讨,提出了一个用于标注藏语句子中动词论元成分的语义角色分类体系。该体系共有21种角色,结合藏文文法并通过具体实例对相应的角色进行了定义,确定了语义角色标记集,为构建藏语语义角色标注数据集提供了理论支撑。 展开更多
关键词 藏语 动词 语义角色 分类体系 标记集
下载PDF
基于格序列的藏语句法成分标注数据集构建方法研究
14
作者 尕藏扎西 冷本扎西 多拉 《高原科学研究》 CSCD 2023年第4期95-105,共11页
在藏语自然语言处理研究中,藏语数据资源严重稀缺,基于大数据驱动的句法研究范式尚不可行,且目前还未构建公开可用的句法成分标注库,藏语句法成分标注数据集成为攻克深层句法分析及自然语言理解的关键制约。文章通过计算语言学、藏语格... 在藏语自然语言处理研究中,藏语数据资源严重稀缺,基于大数据驱动的句法研究范式尚不可行,且目前还未构建公开可用的句法成分标注库,藏语句法成分标注数据集成为攻克深层句法分析及自然语言理解的关键制约。文章通过计算语言学、藏语格语法等多学科方法,研究格序列标记对藏语句法结构的制约和标识功能;再进行形式化描述,最终制定一套以格标记语义功能为主要依据,以谓词等其他形式标记为辅助依据的藏语句法成分标注数据集构建方法。在藏语单、双谓语句及多谓语句、通格结构类复杂句型中开放测试显示,avg_total方案的精确率、召回率、F1值分别达到87.08%、75.36%、80.69%。 展开更多
关键词 藏语 格助词 句法标注 句法成分
下载PDF
从菲尔墨格语法谈藏语格范畴
15
作者 万么加 多拉 《青海师范大学学报(藏文版)》 2023年第1期129-140,共12页
Fillmore格语法是美国语言学家米勒德•菲尔莫尔(Millard Fillmore)在20世纪60年代提出来的。Fillmore认为Chomsky提出来的深层结构的语法关系实际上属于表层结构的主谓概念,而“格”才是真正深层结构中的语法关系。格是普遍存在于所有... Fillmore格语法是美国语言学家米勒德•菲尔莫尔(Millard Fillmore)在20世纪60年代提出来的。Fillmore认为Chomsky提出来的深层结构的语法关系实际上属于表层结构的主谓概念,而“格”才是真正深层结构中的语法关系。格是普遍存在于所有语言中的“格功能”或“格关系”。通过研究发现,藏语传统语法中所提到的格结构体与Fillmore格语法理论中的格之间有着极其相似之处,比如,Fillmore提出的施事格、与格、方位格对应藏语传统格语法的作格、业格与依格。格语法的中心是动词,每个动词都可支配一定的格。藏语传统文法,亦是如此,把格助词作为虚词中的一个特殊成分,用格助词来表达名词或名词性成分与动词之间的关系,是构成句子的重要成分。但从计算语言学来说,藏语语法存在着重义轻形的问题,即缺乏对句子结构的分析方法。因此,通过比较研究方法阐述Fillmore格语法与藏语传统语法之间的关系,提出了一种新的研究方法,即句法语义一体化。用此来揭示主语、宾语等句法成分跟施事、受事等语义成分之间的连接规则,证实了句法语义一体化才能使藏语语法和英汉语法一样变得结构化及系统化。相对于标准语法而言,格语法研究方法更适合去描述藏语语言的特点,故将该研究方法应用到藏语言的教学和研究中,这对藏语语法研究和藏语自然语言处理具有一定的启示意义。 展开更多
关键词 菲尔墨格语法 “格”辨 句法语义一体化
下载PDF
水声网络不等差错保护的避环ROFC-LF码算法与分析
16
作者 柳秀秀 杜秀娟 韩多亮 《电子学报》 EI CAS CSCD 北大核心 2024年第8期2591-2606,共16页
随着智慧海洋的发展,水声网络多媒体数据的传输受到学者关注.水声网络高度动态的拓扑导致相邻节点数据传输不完整,压缩的水下图像或视频等数据对重建数据的质量有不同影响,因此水声网络需要具有不等差错保护(Unequal Error Protection,U... 随着智慧海洋的发展,水声网络多媒体数据的传输受到学者关注.水声网络高度动态的拓扑导致相邻节点数据传输不完整,压缩的水下图像或视频等数据对重建数据的质量有不同影响,因此水声网络需要具有不等差错保护(Unequal Error Protection,UEP)的编码机制来编解码重要性不等的多媒体数据.递归与限制反馈的在线喷泉码(Recursive Online Fountain Code with Limited Feedback,ROFC-LF)具有开销低、反馈少及编译码简单等特点,因此适用于水声网络.本文针对水声信道带宽窄、延时长及能量受限等特点,系统地分析了ROFC-LF编码机制建立阶段存在的环问题.针对ROFC-LF编码存在的环和无法提供UEP功能这两个问题,本文提出了两个优化目标.此外,还提出了具有不等差错保护的避环ROFC-LF编码机制.该编码机制减少了由于建立阶段最大组件存在环引起的无用编码包的数量,进而降低了网络能耗.不等差错保护的避环ROFC-LF编码机制在建立阶段和完成阶段分别采用权重策略和数据优先级策略来实现UEP特性,并利用随机图理论对该编码机制进行理论分析,理论结果和仿真实验结果一致.结果表明:该编码机制能够快速的恢复重要数据的同时,降低了编码包的数量,适用于网络拓扑结构动态变化的水声网络传输重要性不等的多媒体数据. 展开更多
关键词 水声网络 ROFC-LF 不等差错保护 避环 权重 数据优先级
下载PDF
基于无监督学习和监督学习的抽取式文本摘要综述 被引量:2
17
作者 夏吾吉 黄鹤鸣 +1 位作者 更藏措毛 范玉涛 《计算机应用》 CSCD 北大核心 2024年第4期1035-1048,共14页
相较于生成式摘要方法,抽取式摘要方法简单易行、可读性强,使用范围广。目前,抽取式摘要方法综述文献仅对特定的某个方法或领域进行分析综述,缺乏多方面、多语种的系统性综述,因此探讨文本摘要生成任务的内涵,通过系统梳理和提炼现有的... 相较于生成式摘要方法,抽取式摘要方法简单易行、可读性强,使用范围广。目前,抽取式摘要方法综述文献仅对特定的某个方法或领域进行分析综述,缺乏多方面、多语种的系统性综述,因此探讨文本摘要生成任务的内涵,通过系统梳理和提炼现有的相关文献,对无监督学习和监督学习的抽取式文本摘要技术进行多维度、全方位的分析。首先,回顾文本摘要技术的发展,分析不同的抽取式文本摘要方法,主要包括基于规则、词频-逆文件概率(TFIDF)、中心性方法、潜在语义、深度学习、图排序、特征工程和预训练学习等,并对比不同方法的差异;其次,详细介绍不同语种文本摘要生成的常用数据集和主流的评价指标,通过不同的实验指标对相同数据集上的方法进行比较;最后,指出当前抽取式文本摘要研究中存在的主要问题和挑战,并提出具体的解决思路和未来发展趋势。 展开更多
关键词 抽取式摘要 无监督学习 监督学习 数据集 评价指标
下载PDF
融合坐标与多头注意力机制的交互语音情感识别 被引量:1
18
作者 高鹏淇 黄鹤鸣 樊永红 《计算机应用》 CSCD 北大核心 2024年第8期2400-2406,共7页
语音情感识别(SER)是人机交互系统中一项重要且充满挑战性的任务。针对目前SER系统中存在特征单一和特征间交互性较弱的问题,提出多输入交互注意力网络MIAN。该网络由特定特征坐标残差注意力网络和共享特征多头注意力网络两个子网络组... 语音情感识别(SER)是人机交互系统中一项重要且充满挑战性的任务。针对目前SER系统中存在特征单一和特征间交互性较弱的问题,提出多输入交互注意力网络MIAN。该网络由特定特征坐标残差注意力网络和共享特征多头注意力网络两个子网络组成。前者利用Res2Net和坐标注意力模块学习从原始语音中获取的特定特征,并生成多尺度特征表示,增强模型对情感相关信息的表征能力;后者融合前向网络所获取的特征,组成共享特征,并经双向长短时记忆(BiLSTM)网络输入至多头注意力模块,能同时关注不同特征子空间中的相关信息,增强特征之间的交互性,以捕获判别性强的特征。通过2个子网络间的协同作用,能增加模型特征的多样性,增强特征之间的交互能力。在训练过程中,应用双损失函数共同监督,使同类样本更紧凑、不同类样本更分离。实验结果表明,MIAN在EMO-DB和IEMOCAP语料库上分别取得了91.43%和76.33%的加权平均精度,相较于其他主流模型,具有更好的分类性能。 展开更多
关键词 语音情感识别 坐标注意力机制 多头注意力机制 特定特征学习 共享特征学习
下载PDF
超图神经网络综述 被引量:1
19
作者 林晶晶 冶忠林 +1 位作者 赵海兴 李卓然 《计算机研究与发展》 EI CSCD 北大核心 2024年第2期362-384,共23页
近年来,图神经网络借助大量数据和超强计算能力在推荐系统和自然语言处理等应用领域取得显著成效,它主要处理具有成对关系的图数据.但许多现实网络中的对象之间的关系是复杂的非成对关系,如科研合作网络、蛋白质网络等.若直接用图结构... 近年来,图神经网络借助大量数据和超强计算能力在推荐系统和自然语言处理等应用领域取得显著成效,它主要处理具有成对关系的图数据.但许多现实网络中的对象之间的关系是复杂的非成对关系,如科研合作网络、蛋白质网络等.若直接用图结构将这种复杂的关系表示为成对关系,会导致信息丢失.超图是一种灵活的建模工具,可以展现出图无法完整刻画的高阶关系,弥补了图的不足.鉴于此,研究者开始关心如何在超图上设计神经网络,并相继提出应用于下游任务的超图神经网络模型(hypergraph neural network,HGNNs).故对现有的超图神经网络模型进行综述,首先全面回顾超图神经网络在过去3年的研究历程;其次根据设计超图神经网络采用的方法不同对其进行分类,并详细地阐述代表性的模型;然后介绍了超图神经网络的应用领域;最后总结和探讨了超图神经网络未来的研究方向. 展开更多
关键词 超图 超图神经网络 分类 图神经网络
下载PDF
面向不平衡数据集的语音情感识别研究 被引量:1
20
作者 张会云 黄鹤鸣 《计算机工程与应用》 CSCD 北大核心 2024年第4期122-132,共11页
样本平衡对机器学习至关重要,在不平衡数据集中,虽然某些类别的样本数量可能很少,但其重要性可能更高。研究了基于不平衡数据集的语音情感识别技术。在不同信噪比下采用不同噪声对不平衡基线数据集EMODB和IEMOCAP进行扩充,构建含噪数据... 样本平衡对机器学习至关重要,在不平衡数据集中,虽然某些类别的样本数量可能很少,但其重要性可能更高。研究了基于不平衡数据集的语音情感识别技术。在不同信噪比下采用不同噪声对不平衡基线数据集EMODB和IEMOCAP进行扩充,构建含噪数据集EMODBM和IEMOCAPM;采用SMOTE、RandomOverSampler、SMOTEENN、ADASYN、TomekLinks以及SMOTETomek等6种技术对基线数据集和含噪数据集进行重采样,实现类别样本平衡;在基线数据集和扩充数据集上分别提取21维的低级描述符特征;采用新提出的模型MA-CapsNet验证重采样技术的有效性。实验表明,重采样后各类情感样本基本平衡,使模型的学习更公平、更客观,并且模型在重采样数据集上的鲁棒性更好。 展开更多
关键词 语音情感识别 重采样 胶囊网络 数据扩充
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部