期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于临界频带的交互性双支路单通道语音增强模型 被引量:1
1
作者 叶中付 赵紫微 于润祥 《数据采集与处理》 CSCD 北大核心 2023年第2期262-273,共12页
针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题,设计了一种基于人耳临界频带的交互性双支路模型。主要做法为,在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理,提取子带信息;在... 针对目前主流的双支路单通道语音增强方法只关注全频带信息而忽略子频带信息这一问题,设计了一种基于人耳临界频带的交互性双支路模型。主要做法为,在复数谱支路上实施模拟人耳临界频带的划分方法对信号进行分频带处理,提取子带信息;在幅度补偿支路上直接对信号的全频带进行处理,提取全频带信息。复数谱支路负责初步恢复干净语音的幅度和相位,同时,该支路上学到的子带中间特征会被特定的模块传递给幅度补偿支路进行补偿;幅度补偿支路上的输出会对复数谱支路上输出的幅度做进一步的补偿,达到恢复干净语音频谱的目的。实验结果表明,提出的模型在恢复语音质量和可懂度方面优于其他先进的单通道语音增强模型。 展开更多
关键词 临界频带 交互性 子带 双支路 单通道语音增强
下载PDF
针对音变问题改进的维汉神经网络机器翻译鲁棒性方法研究
2
作者 阿里木·赛买提 沙丽瓦尔·阿里木 +3 位作者 卡哈尔·卡迪尔 刘轩铭 凌震华 刘俊华 《新疆师范大学学报(自然科学版)》 2023年第4期1-8,共8页
由于维吾尔语具有音变差异,在记录时容易混淆,这对机器翻译的容错能力提出了挑战。从词粒度研究的角度出发,针对维吾尔语中具有明显语音特性的音变词的翻译问题,采用字符级神经网络机器翻译(Character level Neural Network Machine Tra... 由于维吾尔语具有音变差异,在记录时容易混淆,这对机器翻译的容错能力提出了挑战。从词粒度研究的角度出发,针对维吾尔语中具有明显语音特性的音变词的翻译问题,采用字符级神经网络机器翻译(Character level Neural Network Machine Translation,CharNMT)结构,并结合覆盖率机制进行优化,这一方法不仅提高了音变词的翻译质量,还展现出较好的容错能力。在基础模型取得了1.25 Blue分的提升,并在训练和解码速度方面也具有优势。 展开更多
关键词 维吾尔语音变词 神经网络机器翻译技术 容错能力 字符级神经网络机器翻译
下载PDF
基于自注意力机制的音频对抗样本生成方法
3
作者 李珠海 郭武 《数据采集与处理》 CSCD 北大核心 2024年第2期416-423,共8页
随着个人语音数据在网络上的传播以及自动说话人识别算法的发展,个人的声纹特征面对着泄露的风险。音频对抗样本可以在人耳主观听觉不变的前提下,使得自动说话人识别算法失效,从而保护个人的声纹特征。本文在典型的音频对抗样本生成算法... 随着个人语音数据在网络上的传播以及自动说话人识别算法的发展,个人的声纹特征面对着泄露的风险。音频对抗样本可以在人耳主观听觉不变的前提下,使得自动说话人识别算法失效,从而保护个人的声纹特征。本文在典型的音频对抗样本生成算法FoolHD模型的基础上引入了自注意力机制来改进对抗样本生成,该方法称为FoolHD-MHSA。首先,使用卷积神经网络作为编码器来提取输入音频频谱的对抗扰动谱图;然后利用自注意力机制从全局角度提取扰动谱不同部分特征的关联特征,同时将网络聚焦到扰动谱中的关键信息、抑制无用信息;最后,使用解码器将处理后的扰动谱隐写到输入频谱中得到对抗样本频谱。实验结果表明,FoolHD-MHSA方法生成的对抗样本相比FoolHD方法有着更高的攻击成功率和平均客观语音质量评估(Perceptual evaluation of speech quality,PESQ)得分。 展开更多
关键词 自注意力机制 对抗样本 说话人识别 深度神经网络
下载PDF
分布式麦克风网络中降噪低复杂度能量感知传感器选择
4
作者 张结 许露真 戴礼荣 《中国科学技术大学学报》 CAS CSCD 北大核心 2023年第4期12-21,I0008,共11页
降噪(NR)是许多音频应用系统改善信号质量的必要前端模块。研究表明,稀疏促进的传感器选择方法具有权衡能量消耗和降噪性能的能力,这对大规模无线声学传感器网络(WASNs)非常重要,因为其中很多传感器对降噪的贡献甚微,但是能耗会影响无... 降噪(NR)是许多音频应用系统改善信号质量的必要前端模块。研究表明,稀疏促进的传感器选择方法具有权衡能量消耗和降噪性能的能力,这对大规模无线声学传感器网络(WASNs)非常重要,因为其中很多传感器对降噪的贡献甚微,但是能耗会影响无线声学传感器网络(WASNs)的生存期。本文通过最小化总体能耗和约束输出噪声方差的方式提出了一种基于传感器选择的波束形成降噪(NR)方法。受最优半定规划解(SDP)和实体方法的启发,我们提出了三种低复杂度选择度量准则:加权实体、梯度、加权输入信噪比(SNR)。可以证明,所提基于加权实体和梯度的方法在性能上是近最优的,但是比半定规划方法(SDP)更快,加权信噪比方法以牺牲微弱性能代价换取了最低的时间复杂度。基于仿真无线声学传感器网络(WASN)的数值结果验证了所提方法相对于传统方法的优势。 展开更多
关键词 传感器选择 前向/后向算法 梯度 实体 MVDR波束形成 语音增强 分布式麦克风阵列
下载PDF
结合部首字形和层级结构的手写汉字纠错方法 被引量:1
5
作者 李云青 杜俊 +1 位作者 胡鹏飞 张建树 《中国图象图形学报》 CSCD 北大核心 2023年第8期2382-2395,共14页
目的手写汉字纠错(handwritten Chinese character error correction,HCCEC)任务具有两重性,即判断汉字正确性和对错字进行纠正,该任务在教育场景下应用广泛,可以帮助学生学习汉字、纠正书写错误。由于手写汉字具有复杂的空间结构、多... 目的手写汉字纠错(handwritten Chinese character error correction,HCCEC)任务具有两重性,即判断汉字正确性和对错字进行纠正,该任务在教育场景下应用广泛,可以帮助学生学习汉字、纠正书写错误。由于手写汉字具有复杂的空间结构、多样的书写风格以及巨大的数量,且错字与正确字之间具有高度的相似性,因此,手写汉字纠错的关键是如何精确地建模一个汉字。为此,提出一种层级部首网络(hierarchical radical network,HRN)。方法从部首字形的角度出发,挖掘部首形状结构上的相似性,通过注意力模块捕获包含部首信息的细粒度图像特征,增大相似字之间的区分性。另外,结合汉字本身的层级结构特性,采用基于概率解码的思路,对部首的层级位置进行建模。结果在手写汉字数据集上进行实验,与现有方案相比,HRN在正确字测试集与错字测试集上,精确率分别提升了0.5%和9.8%,修正率在错字测试集上提升了15.3%。此外,通过注意力机制的可视化分析,验证了HRN可以捕捉包含部首信息的细粒度图像特征。部首表征之间的欧氏距离证明了HRN学习到的部首表征向量中包含了部首的字形结构信息。结论本文提出的HRN能够更好地对相似部首进行区分,进而精确地区分正确字与错字,具有很强的鲁棒性和泛化性。 展开更多
关键词 手写汉字纠错(HCCEC) 汉字识别 部首分析 广义零样本学习(GZSL) 注意力机制 卷积神经网络(CNN)
原文传递
用于在线手写公式合成的编解码网络
6
作者 杨晨 杜俊 +1 位作者 薛莫白 张建树 《中国图象图形学报》 CSCD 北大核心 2023年第8期2356-2369,共14页
目的在线公式识别是一种将在线输入手写轨迹点序列转换为公式文本的任务,其广泛应用在手机、平板等便携式设备上。众所周知,训练数据对于神经网络十分重要,但获取有标注的在线公式数据所需要的成本十分昂贵,在训练数据不足的情况下,深... 目的在线公式识别是一种将在线输入手写轨迹点序列转换为公式文本的任务,其广泛应用在手机、平板等便携式设备上。众所周知,训练数据对于神经网络十分重要,但获取有标注的在线公式数据所需要的成本十分昂贵,在训练数据不足的情况下,深度神经网络在该任务上的泛化性和鲁棒性会受到影响。为此,提出了一个基于编码—解码模型的在线数据生成模型。方法该模型从给定的公式文本生成对应的在线轨迹点序列,从而灵活地扩充训练数据规模。生成模型在编码器端设计了结合树形表示的文本特征提取模块,并且引入了基于位置的注意力算法,使模型实现了输入文本序列与输出轨迹序列间的对齐。同时,解码器端融入了不同手写人风格特征,使模型可以生成多种手写人风格的样本。结果实验中,首先,将本文生成方法在不同类型输入文本和不同手写人风格上的结果可视化,并展示了模型在多数情况下的有效性。其次,生成模型合成的额外数据可作为训练集的增广,该数据被用于训练Transformer-TAP(track,attend,and parse)、TAP和DenseTAP-TD(DenseNet TAP with tree decoder)模型,并分析了3种模型在使用增广数据前后的性能变化。结果表明,引入增广数据分进行训练后,3个模型的绝对识别率分别提升了0.98%、1.55%和1.06%;相对识别率分别提升了9.9%、12.37%和9.81%。结论本文提出的在线生成模型可以更加灵活地实现对原有数据集的增广,并有效提升了在线识别模型的泛化性能。 展开更多
关键词 深度学习 手写公式识别 端到端 编解码模型 数据增广
原文传递
通用人工智能的技术进展和典型应用
7
作者 刘庆峰 《国资报告》 2023年第9期92-95,共4页
全球正在掀起人工智能的全新热潮。去年11月30日ChatGPT正式发布,短短两个月其活跃用户就过亿,有报道称89%的美国在校大学生都在用它完成作业。今年6月14日,欧洲议会通过《人工智能法案》,这是全球首部通过议会程序、专门针对人工智能... 全球正在掀起人工智能的全新热潮。去年11月30日ChatGPT正式发布,短短两个月其活跃用户就过亿,有报道称89%的美国在校大学生都在用它完成作业。今年6月14日,欧洲议会通过《人工智能法案》,这是全球首部通过议会程序、专门针对人工智能的综合性立法。 展开更多
关键词 人工智能 活跃用户 欧洲议会 典型应用 CHAT 在校大学生
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部