期刊文献+
共找到13,251篇文章
< 1 2 250 >
每页显示 20 50 100
基于改进Conformer的新闻领域端到端语音识别 被引量:3
1
作者 张济民 早克热·卡德尔 +2 位作者 艾山·吾买尔 申云飞 汪烈军 《中文信息学报》 CSCD 北大核心 2024年第4期156-164,共9页
目前,开源的中文语音识别数据集大多面向通用领域,缺少面向新闻领域的开源语音识别语料库,因此该文构建了面向新闻领域的中文语音识别数据集CH_NEWS_ASR,并使用ESPNET-0.9.6框架的RNN、Transformer和Conformer等模型对数据集的有效性进... 目前,开源的中文语音识别数据集大多面向通用领域,缺少面向新闻领域的开源语音识别语料库,因此该文构建了面向新闻领域的中文语音识别数据集CH_NEWS_ASR,并使用ESPNET-0.9.6框架的RNN、Transformer和Conformer等模型对数据集的有效性进行了验证,实验表明,该文所构建的语料在最好的模型上CER为4.8%,SER为39.4%。由于新闻联播主持人说话语速相对较快,该文构建的数据集文本平均长度为28个字符,是Aishell_1数据集文本平均长度的2倍;且以往的研究中训练目标函数通常为基于字或词水平,缺乏明确的句子水平关系,因此该文提出了一个句子层级的一致性模块,与Conformer模型结合,直接减少源语音和目标文本的表示差异,在开源的Aishell_1数据集上其CER降低0.4%,SER降低2%;在CH_NEWS_ASR数据集上其CER降低0.9%,SER降低3%,实验结果表明,该方法在不增加模型参数量的前提下能有效提升语音识别的质量。 展开更多
关键词 端到端语音识别 conformer 句子层级一致性
下载PDF
基于Conformer的端到端语音识别方法 被引量:1
2
作者 胡从刚 申艺翔 +1 位作者 孙永奇 赵思聪 《计算机应用研究》 CSCD 北大核心 2024年第7期2018-2024,共7页
针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将... 针对Conformer编码器的声学输入网络对FBank语音信息提取不足和通道特征信息缺失问题,提出一种RepVGG-SE-Conformer的端到端语音识别方法。首先,利用RepVGG的多分支结构,增强模型的语音信息提取能力,而在模型推理时通过结构重参数化将多分支融合为单分支,以降低计算复杂度、加快模型推理速度。然后,利用基于压缩和激励网络的通道注意力机制弥补缺失的通道特征信息,以提高语音识别准确率。最后,在公开数据集Aishell-1上的实验结果表明:相较于Conformer,所提出方法的字错误率降低了10.67%,验证了方法的先进性。此外,RepVGG-SE声学输入网络能够有效提高多种Transformer变体的端到端语音识别模型的整体性能,具有很好的泛化能力。 展开更多
关键词 语音识别 conformer RepVGG 压缩和激励网络
下载PDF
基于层次化Conformer的语音合成
3
作者 吴克伟 韩超 +2 位作者 孙永宣 彭梦昊 谢昭 《计算机科学》 CSCD 北大核心 2024年第2期161-171,共11页
语音合成需要将输入语句的文本转换为包含音素、单词和语句的语音信号。现有语音合成方法将语句看作一个整体,难以准确地合成出不同长度的语音信号。通过分析语音信号中蕴含的层次化关系,分别设计基于Conformer的层次化文本编码器和基于... 语音合成需要将输入语句的文本转换为包含音素、单词和语句的语音信号。现有语音合成方法将语句看作一个整体,难以准确地合成出不同长度的语音信号。通过分析语音信号中蕴含的层次化关系,分别设计基于Conformer的层次化文本编码器和基于Conformer的层次化语音编码器,并提出了一种基于层次化文本-语音Conformer的语音合成模型。首先,该模型根据输入文本信号的长度,构建层次化文本编码器,包括音素级、单词级、语句级文本编码器3个层次,不同层次的文本编码器描述不同长度的文本信息;并使用Conformer的注意力机制来学习该长度信号中不同时间特征之间的关系。利用层次化的文本编码器,能够找出语句中不同长度需要强调的信息,有效实现不同长度的文本特征提取,缓解合成的语音信号持续时间长度不确定的问题。其次,层次化语音编码器包括音素级、单词级、语句级语音编码器3个层次。每个层次的语音编码器将文本特征作为Conformer的查询向量,将语音特征作为Conformer的关键字向量和值向量,来提取文本特征和语音特征的匹配关系。利用层次化的语音编码器和文本语音匹配关系,可以缓解不同长度语音信号合成不准确的问题。所提模型的层次化文本-语音编码器可以灵活地嵌入现有的多种解码器中,通过文本和语音之间的互补,提供更为可靠的语音合成结果。在LJSpeech和LibriTTS两个数据集上进行实验验证,实验结果表明,所提方法的梅尔倒谱失真小于现有语音合成方法。 展开更多
关键词 语音合成 文本编码器 语音编码器 层次化模型 conformer
下载PDF
基于Conformer的端到端中英文管制语音识别
4
作者 孔建国 韩琪聪 +1 位作者 梁海军 李煜琨 《航空计算技术》 2024年第3期1-5,共5页
将语音识别技术应用到空中交通管理系统中可以提高飞行安全并降低管制员的工作负荷,目前已有的管制语音识别技术在中英文识别上效果较差,因此提出了一种基于Conformer-CTC/Attention的中英文管制语音识别框架。该方法使用基于改进的Conf... 将语音识别技术应用到空中交通管理系统中可以提高飞行安全并降低管制员的工作负荷,目前已有的管制语音识别技术在中英文识别上效果较差,因此提出了一种基于Conformer-CTC/Attention的中英文管制语音识别框架。该方法使用基于改进的Conformer共享编码器对输入序列进行语言分类并以参数有效的方式对音频序列的局部和全局相依性进行建模,添加了语种分类模块来判断输入语音序列的语种,还采用了CTC解码器和注意力解码器联合解码的多任务建模方法。最后在建立的民航数据集对所提出的框架进行验证,试验结果表明,Conformer-CTC/Attention(Language-Category)相对于基线模型错误率降低,识别效果达到预期。 展开更多
关键词 空中交通管制 中英文语音识别 conformer-CTC/Attention 多任务学习 端到端
下载PDF
基于时频感知双路径Conformer的语音增强
5
作者 芮阳 高勇 《通信技术》 2024年第4期338-346,共9页
近年来,Conformer在语音领域的应用表现较为突出。该模块通过结合多头自注意力机制和卷积神经网络,能够同时关注短时和长时序列信息,从而在语音处理任务中表现出卓越的性能。在此基础上提出了一种基于时频感知双路径Conformer的语音增... 近年来,Conformer在语音领域的应用表现较为突出。该模块通过结合多头自注意力机制和卷积神经网络,能够同时关注短时和长时序列信息,从而在语音处理任务中表现出卓越的性能。在此基础上提出了一种基于时频感知双路径Conformer的语音增强网络(TFDPCNet)。首先,该网络将改进的Conformer结构作为核心,采用双路径结构,构成时频感知的双路径Conformer模块(TFDP-Conformer),增强了整体网络的时频提取能力;同时,为了减小时频特征融合的难度,提出了注意力门控交叉融合模块(AGCF),通过额外的注意力门进一步增强了网络训练过程中时频特征的交互,提高了时频特征的利用率;最后,引用度量鉴别器,并对其进行适当剪枝,使得增强后的音频和原始音频在量化评价指标上保持更高的一致性。实验结果表明,相比于TSTNN算法,TFDPCNet在主观和客观指标上都有明显提高。 展开更多
关键词 语音增强 双路径conformer 时频域 注意力门控交叉融合 度量鉴别器
下载PDF
基于Conformer-SE的端到端语音识别
6
作者 马永杰 李罡 《计算机系统应用》 2024年第12期106-114,共9页
基于自注意力机制的Transformer端到端模型在语音识别任务中表现出了卓越的性能.然而,该模型在浅层处理时对局部特征信息的捕捉能力存在一定的局限,同时也没有充分考虑不同块之间的相互依赖性.为了解决这些问题,提出了一种改进的Conform... 基于自注意力机制的Transformer端到端模型在语音识别任务中表现出了卓越的性能.然而,该模型在浅层处理时对局部特征信息的捕捉能力存在一定的局限,同时也没有充分考虑不同块之间的相互依赖性.为了解决这些问题,提出了一种改进的Conformer-SE端到端语音识别系统模型.该模型首先采用了Conformer结构来替代Transformer中的编码器部分,从而增强了模型对局部特征的提取能力.接着,通过引入SE注意力通道机制,将每个块的输出以加权求和的形式整合到最终的输出中.在Aishell-1这一公开数据集上的实验结果显示,相较于原始的Transformer模型,Conformer-SE模型在字符错误率上相对降低了18.18%. 展开更多
关键词 语音识别 端到端 TRANSFORMER conformer SE注意力通道
下载PDF
基于Conformer模型的智能电网调度语音识别研究
7
作者 邓彬 彭超逸 张宗包 《制造业自动化》 2024年第6期126-131,共6页
完成智能虚拟电网调度,语音识别是重要一部分,识别的准确性直接由语言模型决定。提出一种基于Conformer模型的智能电网调度语音识别技术,在Transformer模型里面引入卷积模块来提高模型的细微特征学习能力,首先介绍了Conformer的原理,并... 完成智能虚拟电网调度,语音识别是重要一部分,识别的准确性直接由语言模型决定。提出一种基于Conformer模型的智能电网调度语音识别技术,在Transformer模型里面引入卷积模块来提高模型的细微特征学习能力,首先介绍了Conformer的原理,并结合LAS解码器构建了语音识别模型;然后输入电网调度语言进行特征提取,提高模型的适应性;最后通过试验验证,所提模型在电网调度语音识别中具有很高的准确性,验证相对于常见的语音识别Transformer模型与CTC模型,在验证集上的字错率分别降低了11.23%、21.76%,表明模型具有很好的效果。 展开更多
关键词 电网调度 语音识别 conformer TRANSFORMER 特征学习
下载PDF
基于Conformer的实时多场景说话人识别模型 被引量:1
8
作者 宣茜 韩润萍 高静欣 《计算机工程与应用》 CSCD 北大核心 2024年第7期147-156,共10页
为解决在多场景(跨域、长时以及噪声干扰语音场景)下说话人确认系统性能较差的问题,提出了一种基于Conformer构建的、实时多场景鲁棒的说话人识别模型——PMS-Conformer。PMS-Conformer的设计灵感来自于先进的模型MFA-Conformer。PMS-Co... 为解决在多场景(跨域、长时以及噪声干扰语音场景)下说话人确认系统性能较差的问题,提出了一种基于Conformer构建的、实时多场景鲁棒的说话人识别模型——PMS-Conformer。PMS-Conformer的设计灵感来自于先进的模型MFA-Conformer。PMS-Conformer对MFA-Conformer的声学特征提取器、网络组件和损失函数计算模块进行了改进,其具有新颖有效的声学特征提取器,以及鲁棒的、具有较强泛化能力的声纹嵌入码提取器。基于VoxCeleb1&2数据集实现了PMS-Conformer的训练;开展了PMS-Conformer与基线MFA-Conformer以及ECAPA-TDNN在说话人确认任务上的性能对比评估实验。实验结果表明在长语音SITW、跨域VoxMovies以及加噪处理的VoxCeleb-O测试集上,以PMS-Conformer构建的说话人确认系统的性能比用这两个基线构建的说话人确认系统更有竞争力;并且在声纹嵌入码提取器的可训练参数(Params)和推理速度(RTF)方面,PMS-Conformer明显优于ECAPA-TDNN。实验结果说明了PMS-Conformer在实时多场景下具有良好的性能。 展开更多
关键词 说话人确认 MFA-conformer Sub-center AAM-Softmax 声纹嵌入码 声学特征提取
下载PDF
结合Conformer与N-gram的中文语音识别 被引量:5
9
作者 许鸿奎 卢江坤 +5 位作者 张子枫 周俊杰 胡文烨 姜彤彤 郭文涛 李振业 《计算机系统应用》 2022年第7期194-202,共9页
Transformer模型对输入序列中重要的信息进行学习,相比传统的ASR(automatic speech recognition)模型提升了准确性.Conformer模型在Transformer的编码器中加入卷积模块,增加了获取细微局部信息的能力,进一步提高了模型性能.本文结合使用... Transformer模型对输入序列中重要的信息进行学习,相比传统的ASR(automatic speech recognition)模型提升了准确性.Conformer模型在Transformer的编码器中加入卷积模块,增加了获取细微局部信息的能力,进一步提高了模型性能.本文结合使用Conformer模型和N-gram语言模型(language model,LM)用于中文语音识别,获得了良好的识别效果.在数据集AISHELL-1和aidatatang_200zh上的实验表明,使用Conformer模型字错率分别可降低到5.79%和5.60%,较Transformer模型降低了5.82%和2.71%.结合N-gram语言模型后字错率分别可降低到4.86%和5.10%达到最佳性能,实时率(real time factor,RTF)达到0.14566.测试信噪比降低为20 dB时模型字错率才明显下降到8.58%,表明该模型具有一定的抗噪能力. 展开更多
关键词 语音识别 TRANSFORMER 语言模型 conformer 深度学习
下载PDF
Low-Energy Electron Attachment to Serine Conformers: Shape Resonances and Dissociation Dynamics 被引量:1
10
作者 王永峰 田善喜 《Chinese Journal of Chemical Physics》 SCIE CAS CSCD 2017年第2期173-185,I0001,共14页
Shape resonances of electron-molecule system formed in the low-energy electron attachment to four low-lying conformers of serine (serine 1, serine 2, serine 3, and serine 4) in gas phase are investigated using the q... Shape resonances of electron-molecule system formed in the low-energy electron attachment to four low-lying conformers of serine (serine 1, serine 2, serine 3, and serine 4) in gas phase are investigated using the quantum scattering method with the non-empirical model potentials in single-center expansion. In the attachment energy range of 0-10 eV, three shape resonances for serine 1, serine 2, and serine 4 and four shape resonances for serine 3 are predicted. The one-dimensional potential energy curves of the temporary negative ions of electron-serine are calculated to explore the correlations between the shape resonance and the bond cleavage. The bond-cleavage selectivity of the different resonant states for a certain conformer is demonstrated, and the recent experimental results about the dissociative electron attachment to serine are interpreted on the basis of present calculations. 展开更多
关键词 SERINE conformational effect Shape resonance Dissociative electron attach-ment
下载PDF
基于多尺度阶梯时频Conformer GAN的语音增强算法 被引量:4
11
作者 金玉堂 王以松 +1 位作者 王丽会 赵鹏利 《计算机应用》 CSCD 北大核心 2023年第11期3607-3615,共9页
针对频率域语音增强算法中因相位混乱产生人工伪影,导致去噪性能受限、语音质量不高的问题,提出一种基于多尺度阶梯型时频Conformer生成对抗网络(MSLTF-CMGAN)的语音增强算法。将语音语谱图的实部、虚部和振幅谱作为输入,生成器首先在... 针对频率域语音增强算法中因相位混乱产生人工伪影,导致去噪性能受限、语音质量不高的问题,提出一种基于多尺度阶梯型时频Conformer生成对抗网络(MSLTF-CMGAN)的语音增强算法。将语音语谱图的实部、虚部和振幅谱作为输入,生成器首先在多个尺度上利用时间-频率Conformer学习时域和频域的全局及局部特征依赖;其次,利用Mask Decoder分支学习振幅掩码,而Complex Decoder分支则直接学习干净的语谱图,融合这两个Decoder分支的输出可得到重建后的语音;最后,利用指标判别器判别语音的评价指标得分,通过极大极小训练使生成器生成高质量的语音。采用主观评价平均意见得分(MOS)和客观评价指标在公开数据集VoiceBank+Demand上与各类语音增强模型进行对比,结果显示,所提算法的MOS信号失真(CSIG)和MOS噪声失真(CBAK)比目前最先进的方法CMGAN(基于Conformer的指标生成对抗网络语音增强模型)分别提高了0.04和0.07,尽管它的MOS整体语音质量(COVL)和语音质量的感知评估(PESQ)略低于CMGAN,但与其他对比模型相比在多项主客观语音质量评估方面的评分均处于领先水平。 展开更多
关键词 语音增强 多尺度 conformer 生成对抗网络 指标判别器 深度学习
下载PDF
基于Conformer的端到端语音识别模型的压缩优化策略 被引量:1
12
作者 桑江坤 努尔麦麦提·尤鲁瓦斯 《信号处理》 CSCD 北大核心 2022年第12期2639-2649,共11页
随着深度学习的兴起,端到端语音识别模型受到越来越多的关注。最近,基于Conformer框架的提出,使得端到端语音识别模型的性能得到进一步的提升,同时在语音识别领域也得到了广泛的应用。然而,这些端到端模型由于内存和计算需求较大,所以... 随着深度学习的兴起,端到端语音识别模型受到越来越多的关注。最近,基于Conformer框架的提出,使得端到端语音识别模型的性能得到进一步的提升,同时在语音识别领域也得到了广泛的应用。然而,这些端到端模型由于内存和计算需求较大,所以在资源有限的设备上部署和推理是受限的。该文为了保证模型精度损失较小的情况下,尽可能地减少模型的大小和计算量,分别采用了模型量化,基于权重通道的结构化剪枝以及奇异值分解等三种压缩优化策略,同时对模型量化进行了改进。探究了不同程度的压缩对模型精度损失所造成的影响。通过结合这些策略在不同设备进行了测试,相比于基线在其字错误率误差小于3%的情况下,模型推理识别的速度约提升3~4倍。 展开更多
关键词 深度学习 端到端语音识别 conformer 量化 剪枝 分解
下载PDF
基于Conformer的时域多通道语音分离方法 被引量:1
13
作者 陈佳佳 张海剑 华光 《无线电工程》 北大核心 2023年第9期2054-2060,共7页
多通道语音中的空间特征信息为说话人分离提供了重要的线索,为了更好地提取通道间信息并有效降低网络的处理时延,提出一种多通道时域语音分离方法。利用多层编码器实现语音特征提取并挖掘通道间信息,在逐层编码过程中获得不同时间分辨... 多通道语音中的空间特征信息为说话人分离提供了重要的线索,为了更好地提取通道间信息并有效降低网络的处理时延,提出一种多通道时域语音分离方法。利用多层编码器实现语音特征提取并挖掘通道间信息,在逐层编码过程中获得不同时间分辨率的语音特征并降低特征时间维度;引入Conformer结构对语音全局时间关系进行建模,在解码阶段使用特征加权跳跃连接融合对应编码层的输出特征进行解码,并将高维语音特征恢复为时域信号。在基于LibriSpeech仿真的多通道混响带噪语音数据集中进行实验,实验结果表明,所提方法通过多层编解码机制充分利用了多通道语音信息并降低了网络处理时延,通过Conformer实现并行数据处理和全局时间关系建模,在推理速度、分离语音质量和语音感知质量方面均优于基线单通道和多通道时域语音分离算法。 展开更多
关键词 语音分离 conformer 多通道 多层编码器
下载PDF
使用Conformer增强的混合CTC/Attention端到端中文语音识别 被引量:7
14
作者 陈戈 谢旭康 +1 位作者 孙俊 陈祺东 《计算机工程与应用》 CSCD 北大核心 2023年第4期97-103,共7页
最近,基于自注意力的Transformer结构在不同领域的一系列任务上表现出非常好的性能。探索了基于Transformer编码器和LAS(listen,attend and spell)解码器的Transformer-LAS语音识别模型的效果,并针对Transformer不善于捕捉局部信息的问... 最近,基于自注意力的Transformer结构在不同领域的一系列任务上表现出非常好的性能。探索了基于Transformer编码器和LAS(listen,attend and spell)解码器的Transformer-LAS语音识别模型的效果,并针对Transformer不善于捕捉局部信息的问题,使用Conformer代替Transformer,提出Conformer-LAS模型。由于Attention过于灵活的对齐方式,使得在嘈杂环境中的效果急剧下降,采用连接时序分类(connectionist temporal classification,CTC)辅助训练以加快收敛,并加入音素级别的中间CTC损失联合优化,提出了效果更好的Conformer-LAS-CTC语音识别模型。在开源中文普通话Aishell-1数据集上对提出来的模型进行验证,实验结果表明,Conformer-LAS-CTC相对于采用的基线BLSTM-LAS和Transformer-LAS模型在测试集上的字错率分别相对降低了22.58%和48.76%,模型最终字错误率为4.54%。 展开更多
关键词 端到端 语音识别 conformer LAS 连接时序分类
下载PDF
基于LSTM和Conformer的下肢外骨骼步态预测方法 被引量:2
15
作者 赵侦钧 王涛 +1 位作者 贝太学 宋涛涛 《计算机时代》 2022年第8期1-5,共5页
提出一种新颖的基于长短期记忆神经网络(Long Short-term Memory,LSTM)和Conformer相结合的步态预测方法,用于解决下肢外骨骼人机协同问题。首先利用LSTM网络模型在时间上对步态数据序列做初步的特征提取及预测,然后采用Conformer模型对... 提出一种新颖的基于长短期记忆神经网络(Long Short-term Memory,LSTM)和Conformer相结合的步态预测方法,用于解决下肢外骨骼人机协同问题。首先利用LSTM网络模型在时间上对步态数据序列做初步的特征提取及预测,然后采用Conformer模型对LSTM模型输出的数据在时空上作进一步的深度特征提取,并经线性激活单元输出预测结果。利用Pytorch搭建LSTM-Conformer神经网络模型,由采集到的下肢姿态数据组建成的数据集作为输入,将步态所属类别标签作为输出进行验证。实验结果表明,拟议网络模型平均准确率达到了94.89%。 展开更多
关键词 外骨骼 步态预测 九轴姿态传感器 长短期记忆网络 conformer模型
下载PDF
基于U-Conformer的多特征融合鸟鸣声分离方法
16
作者 倪东明 石煜炜 +1 位作者 夏灿玮 谢将剑 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期388-395,共8页
针对多个鸟类个体同时发声导致的鸣声混叠问题,本文提出了一种融合录音通道间空间特征的鸟类鸣声分离方法.该方法将混叠鸣声信号的声谱特征和空间特征作为分离模型的输入,提出深度学习模型U-Conformer来预测每个鸣声源方向的幅值谱掩膜(... 针对多个鸟类个体同时发声导致的鸣声混叠问题,本文提出了一种融合录音通道间空间特征的鸟类鸣声分离方法.该方法将混叠鸣声信号的声谱特征和空间特征作为分离模型的输入,提出深度学习模型U-Conformer来预测每个鸣声源方向的幅值谱掩膜(spectral magnitude mask,SMM),通过模型估计的SMM从混叠鸣声信号中恢复每个鸣声源信号.由多源混叠鸟类鸣声数据的实验结果表明,本文提出的分离方法较其他深度学习模型结构具有更好的分离效果,有助于更好地分析野外鸟类鸣声录音. 展开更多
关键词 鸟鸣声分离 空间特征 conformer 幅值谱掩膜
下载PDF
A new member of the calix[4]crown family:Facile synthesis and characterization of a calix[4]crown-9 cone conformer 被引量:1
17
作者 Hao Hui Zhou Xian Mei Shang Zhi Luo Yu Xiang Xia Jun Luo Guang Ya Xiang 《Chinese Chemical Letters》 SCIE CAS CSCD 2009年第2期143-146,共4页
25,27-Dipropoxy-p-tert-butylcalix[4]crown-9 cone conformer 5 was readily synthesized via an intramolecular cyclization strategy in good yields. The structures of all the new compounds involved were confirmed by NMR, E... 25,27-Dipropoxy-p-tert-butylcalix[4]crown-9 cone conformer 5 was readily synthesized via an intramolecular cyclization strategy in good yields. The structures of all the new compounds involved were confirmed by NMR, ESI-MS and elemental analyses. All of them were proved to be in the cone conformation. 展开更多
关键词 crown-9 Cone conformation Synthesis Intramolecular cyclization
下载PDF
语音识别中的Conformer模型压缩研究
18
作者 卢江坤 许鸿奎 +3 位作者 张子枫 周俊杰 李振业 郭文涛 《计算机时代》 2023年第4期16-22,28,共8页
针对使用Conformer模型的语音识别算法在实际应用时设备算力不足及资源缺乏的问题,提出一种基于Conformer模型间隔剪枝和参数量化相结合的模型压缩方法。实验显示,使用该方法压缩后,模型的实时率(real time factor, RTF)达到0.107614,... 针对使用Conformer模型的语音识别算法在实际应用时设备算力不足及资源缺乏的问题,提出一种基于Conformer模型间隔剪枝和参数量化相结合的模型压缩方法。实验显示,使用该方法压缩后,模型的实时率(real time factor, RTF)达到0.107614,较基线模型的推理速度提升了16.2%,而识别准确率只下降了1.79%,并且模型大小也由原来的207.91MB下降到72.69MB。该方法在模型准确率损失很小的情况下,较大程度地提升了模型的适用性。 展开更多
关键词 深度学习 模型压缩 模型量化 模型剪枝 conformer
下载PDF
Classifying rockburst with confidence:A novel conformal prediction approach 被引量:3
19
作者 Bemah Ibrahim Isaac Ahenkorah 《International Journal of Mining Science and Technology》 SCIE EI CAS CSCD 2024年第1期51-64,共14页
The scientific community recognizes the seriousness of rockbursts and the need for effective mitigation measures.The literature reports various successful applications of machine learning(ML)models for rockburst asses... The scientific community recognizes the seriousness of rockbursts and the need for effective mitigation measures.The literature reports various successful applications of machine learning(ML)models for rockburst assessment;however,a significant question remains unanswered:How reliable are these models,and at what confidence level are classifications made?Typically,ML models output single rockburst grade even in the face of intricate and out-of-distribution samples,without any associated confidence value.Given the susceptibility of ML models to errors,it becomes imperative to quantify their uncertainty to prevent consequential failures.To address this issue,we propose a conformal prediction(CP)framework built on traditional ML models(extreme gradient boosting and random forest)to generate valid classifications of rockburst while producing a measure of confidence for its output.The proposed framework guarantees marginal coverage and,in most cases,conditional coverage on the test dataset.The CP was evaluated on a rockburst case in the Sanshandao Gold Mine in China,where it achieved high coverage and efficiency at applicable confidence levels.Significantly,the CP identified several“confident”classifications from the traditional ML model as unreliable,necessitating expert verification for informed decision-making.The proposed framework improves the reliability and accuracy of rockburst assessments,with the potential to bolster user confidence. 展开更多
关键词 ROCKBURST Machine learning Uncertainty quantification conformal prediction
下载PDF
High-level theoretical study of the evolution of abundances and interconversion of glycine conformers
20
作者 Fan Liu Jing Yu Yan-Ru Huang 《Chinese Physics B》 SCIE EI CAS CSCD 2018年第4期264-271,共8页
The relative conformer energies of glycine are evaluated by using a focal point analysis expressed as(HF→MP2→MP3→CCSD→CCSD(T)).The conformer abundances at various temperatures(298–500 K) are calculated base... The relative conformer energies of glycine are evaluated by using a focal point analysis expressed as(HF→MP2→MP3→CCSD→CCSD(T)).The conformer abundances at various temperatures(298–500 K) are calculated based on the relative energies and Boltzmann statistical thermostatistical analysis with and without considering internal hindered rotations.A comparison between the available Raman spectrum and the electron momentum spectrum confirms that the influence of rigid-rotor hindered rotation on the conformational proportions of glycine is considerable,especially for the IIIp structure.The conformational interconversions are discussed.It is found that with increasing temperature,the mole fraction of IIn keeps constant and Ip structure can convert into IVn and IIIp,leading to the decrease in the weight of Ip and the increase in the weights of IVn and IIIp conformers,which is in accordance with experimental observations. 展开更多
关键词 GLYCINE conformATION ABUNDANCE INTERCONVERSION
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部