期刊文献+
共找到57,964篇文章
< 1 2 250 >
每页显示 20 50 100
生成式伪造语音安全问题与解决方案
1
作者 冯畅 吴晓龙 +2 位作者 赵熠扬 徐明星 郑方 《信息安全研究》 CSCD 北大核心 2024年第2期122-129,共8页
生成式人工智能算法的发展使得生成式伪造语音更加自然流畅,人类听力难以分辨真伪.首先分析了生成式伪造语音不当滥用对社会造成的一系列威胁,如电信诈骗更加泛滥、语音应用程序安全性下降、司法鉴定公正性受到影响、综合多领域的伪造... 生成式人工智能算法的发展使得生成式伪造语音更加自然流畅,人类听力难以分辨真伪.首先分析了生成式伪造语音不当滥用对社会造成的一系列威胁,如电信诈骗更加泛滥、语音应用程序安全性下降、司法鉴定公正性受到影响、综合多领域的伪造信息欺骗社会大众等.然后从技术发展角度,对生成式伪造语音的生成算法和检测算法分别进行总结与分类,阐述算法流程步骤及其中的关键点,并分析了技术应用的挑战点.最后从技术应用、制度规范、公众教育、国际合作4方面阐述了如何预防以及解决生成式伪造语音带来的安全问题. 展开更多
关键词 生成式人工智能 伪造语音 伪造语音安全问题 伪造语音检测 伪造语音威胁解决
下载PDF
智能导盲拐杖的语音交互方法
2
作者 刘世龙 谢典 +3 位作者 唐志远 吴昊 华莲莲 李春华 《物联网技术》 2024年第3期128-130,共3页
文中设计出一款多功能智能拐杖,可以实现路径规划、自主导航、物品识别、语音交互等功能,最重要的是可以让老人对智能拐杖进行语音控制,使之更加便捷化、智能化,从而更好地为老人服务。语音交互功能采用STM32F405作为底层开发板,分为语... 文中设计出一款多功能智能拐杖,可以实现路径规划、自主导航、物品识别、语音交互等功能,最重要的是可以让老人对智能拐杖进行语音控制,使之更加便捷化、智能化,从而更好地为老人服务。语音交互功能采用STM32F405作为底层开发板,分为语音识别、语音合成以及语音控制等部分。 展开更多
关键词 智能拐杖 语音交互 STM32 语音识别 语音合成 语音控制
下载PDF
基于频谱分析仪的语音识别及控制软件系统设计 被引量:3
3
作者 赵元琪 尹永柯 +1 位作者 王洪君 房明 《现代电子技术》 北大核心 2024年第6期27-31,共5页
随着数据处理技术的进步和人工智能领域的高速发展,用户在对仪器的实际使用中持续追求更为高效便捷的操控方式,同时也相当看重使用过程的灵活性和准确性,语音数据因其实用性和高效性而被广泛使用。因此,提出一种基于频谱分析仪的语音识... 随着数据处理技术的进步和人工智能领域的高速发展,用户在对仪器的实际使用中持续追求更为高效便捷的操控方式,同时也相当看重使用过程的灵活性和准确性,语音数据因其实用性和高效性而被广泛使用。因此,提出一种基于频谱分析仪的语音识别及控制软件系统。该系统支持Ubuntu 18.04及以上版本操作系统,通过语音指令实现对频谱分析仪的控制,可以实现语音唤醒、语音录入及保存、离线语音识别并转换为文字文本、可执行代码等功能。 展开更多
关键词 语音识别 控制软件 频谱分析仪 UBUNTU 语音唤醒 语音听写
下载PDF
基于深度学习的目标说话人语音提取
4
作者 王志雄 《电脑知识与技术》 2024年第10期37-40,共4页
人类能够在多人交谈的复杂环境中专注并识别目标说话人的语音,而现有机器技术尚未完全达到这一水平。针对这一实际应用场景,本文提出了一种时域目标说话人语音提取网络架构,该架构无需将混合语音分解为幅度谱和相位谱,而是直接将其转换... 人类能够在多人交谈的复杂环境中专注并识别目标说话人的语音,而现有机器技术尚未完全达到这一水平。针对这一实际应用场景,本文提出了一种时域目标说话人语音提取网络架构,该架构无需将混合语音分解为幅度谱和相位谱,而是直接将其转换为嵌入系数,从而规避了复杂的相位估计。该网络由四个关键部分构成,即说话人辅助网络、语音编码器、目标说话人语音提取器以及语音解码器。具体而言,语音编码器负责将混合语音转化为嵌入系数;说话人辅助网络则通过学习以说话人嵌入形式表示目标说话人特征;目标说话人语音提取器以嵌入系数与目标说话人嵌入作为输入,进而估计出一个接收掩模;最后,语音解码器根据处理过的嵌入系数重新构造出目标说话人的语音。实验结果显示,在开放评测环境下,相较于基准模型,所提方法在SDR(Signal-to-Distortion Ratio)和SI-SDR(Source-to-Interference Signal-to-Distortion Ratio)指标上分别取得了相对提升2.62dB和2.52dB的成绩。实验结果有力证明了该方法具有更好的抗干扰性和泛化性能。 展开更多
关键词 单通道 目标说话人语音提取 时域语音信号 泛化性 语音编码器 语音解码器
下载PDF
中国成人英语学习者的语音学习策略与语音可理解度的关系研究
5
作者 邓若岚 陈虹樾 《四川文理学院学报》 2024年第4期77-84,共8页
语音学习策略(Pronunciation Learning Strategies,PLS)在第二语言语音(Second Language Speech)研究领域占据重要地位,关于中国成人英语学习者(English as a Foreign Language,EFL)如何运用这些策略以提升语音可理解度的研究相对缺乏... 语音学习策略(Pronunciation Learning Strategies,PLS)在第二语言语音(Second Language Speech)研究领域占据重要地位,关于中国成人英语学习者(English as a Foreign Language,EFL)如何运用这些策略以提升语音可理解度的研究相对缺乏。以一所公立大学本科三年级英语专业学生为样本,采用诱导性自然话语语料,辅以问卷调查手段,系统性地考察了学习者在语音学习过程中所采用的各类策略。研究结果表明,就自然话语而言,尽管语音学习策略的整体运用与语音可理解度之间并无显著相关性,但是输入/练习类策略在提升语音可理解度方面的效果尤为突出。这一发现对基于策略的英语语音课堂教学设计具有重要的指导意义。 展开更多
关键词 语音学习策略 语音可理解度 中国英语学习者 英语语音教学
下载PDF
基于STM32的语音信号处理与传输技术研究 被引量:1
6
作者 王宝妮 包艳艳 倪子越 《产业创新研究》 2024年第6期112-114,共3页
为了提高语音信号处理技术在工业生产及日常沟通中的应用效果,本文首先对当前语音信号处理技术的发展及应用进行了概述,并针对实时或嵌入式情况下,语音信号的处理及传输问题,提出一种基于STM32芯片的语音信号处理及传输系统,并且针对系... 为了提高语音信号处理技术在工业生产及日常沟通中的应用效果,本文首先对当前语音信号处理技术的发展及应用进行了概述,并针对实时或嵌入式情况下,语音信号的处理及传输问题,提出一种基于STM32芯片的语音信号处理及传输系统,并且针对系统在复杂噪声环境下的语音传输的质量问题,在系统中引入基于包含两个子网络的循环神经网络的语音增强模型对其进行优化。实验结果表明,在引入所提改进循环神经网络的语音增强模型后,降噪语音相较于原始混合语音信号,相关声学特征更明显,PSSQ和STOI分别提高了30.57%和11.27%。相较于DTLN模型,所提模型不仅在复杂度有了大大降低,Params和FLOPS分别减少了62.77%和62.42%,语音增强的性能也有一定程度地提高,综合效果最好。 展开更多
关键词 语音信号 嵌入式单片机 循环神经网络 语音传输 语音增强
下载PDF
基于小波变换的语音信号去噪算法优化
7
作者 王红娟 尚莹莹 《电声技术》 2024年第5期67-69,共3页
深入研究基于小波变换的语音信号去噪方法,并针对传统方法在复杂噪声环境下处理效果不佳的问题,提出一种基于自适应阈值的小波变换去噪优化方法。首先,分析小波变换去噪的基本原理。其次,深入研究自适应阈值技术的数学模型,并将其应用... 深入研究基于小波变换的语音信号去噪方法,并针对传统方法在复杂噪声环境下处理效果不佳的问题,提出一种基于自适应阈值的小波变换去噪优化方法。首先,分析小波变换去噪的基本原理。其次,深入研究自适应阈值技术的数学模型,并将其应用于小波变换,通过动态调整阈值来适应不同噪声环境的需求。最后,采用Aurora数据集进行实验验证。实验结果表明,该方法能够有效去除噪声。 展开更多
关键词 小波变换 语音去噪 自适应阈值 语音信号
下载PDF
语音助手设备中的自适应实时语音处理方法研究
8
作者 晁松杰 娄艺 《电声技术》 2024年第2期42-44,共3页
文章研究了一种基于门控循环单元(Gated Recurrent Unit,GRU)的实时语音去噪和增强方法,以优化语音助手设备的性能。介绍语音助手的基本结构,引入GRU模型作为关键组成部分,提高语音去噪和增强的效果。实验阶段采用noisex-92数据集,通过... 文章研究了一种基于门控循环单元(Gated Recurrent Unit,GRU)的实时语音去噪和增强方法,以优化语音助手设备的性能。介绍语音助手的基本结构,引入GRU模型作为关键组成部分,提高语音去噪和增强的效果。实验阶段采用noisex-92数据集,通过信噪比(Signal-to-Noise Ratio,SNR)增益和语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)等指标对方法进行全面评估。实验结果表明,所提方法在提高语音质量和用户体验方面具备显著优势。 展开更多
关键词 语音助手 门控循环单元 语音去噪 语音增强
下载PDF
合成语音与自然语音的音高差异——从18种语言核心词看合成语音的音高特点
9
作者 王帅 《天津外国语大学学报》 2024年第5期88-98,F0003,共12页
论文以18种语言核心词的合成语音和自然语音为研究对象,从音高均值、最大值、最小值、标准差以及单位时间内词的音高变化幅度分析了合成语音和自然语音的音高表现,考察了合成语音的音高特点。整体看来,较之自然语音,合成语音的整体音高... 论文以18种语言核心词的合成语音和自然语音为研究对象,从音高均值、最大值、最小值、标准差以及单位时间内词的音高变化幅度分析了合成语音和自然语音的音高表现,考察了合成语音的音高特点。整体看来,较之自然语音,合成语音的整体音高均值低于自然语音。在具体的语言中,合成语音的音高表现存在语言间的差异,部分语言的合成语音和自然语音的音高表现非常接近,而部分语言的合成语音和自然语音的音高表现呈现出了较大的差异。就单位时间内词音高的变化幅度而言,大部分语言的合成语音词音高变化幅度大于自然语音的词音高变化幅度,这种情况与合成语音中的词音高曲线存在畸变的现象有关。 展开更多
关键词 核心词 合成语音 自然语音 音高差异
下载PDF
电动履带式运输机智能语音控制系统的设计
10
作者 谢晓钟 吴尚璟 孙维峰 《机电技术》 2024年第4期63-67,共5页
采用语音识别模块,识别语音命令词控制电动履带式运输机。语音识别模块通过应用配置相关工作模式、识别语音命令词和发送识别语音后对应的通信命令,MCU接收、解析识别语音后对应的通信命令帧,并根据通信命令帧控制履带式运输机前进、后... 采用语音识别模块,识别语音命令词控制电动履带式运输机。语音识别模块通过应用配置相关工作模式、识别语音命令词和发送识别语音后对应的通信命令,MCU接收、解析识别语音后对应的通信命令帧,并根据通信命令帧控制履带式运输机前进、后退、左转、右转、车斗升降以及语音播放执行命令的操作。 展开更多
关键词 电动 履带 运输机 语音识别 MCU处理器 通信命令帧 语音控制
下载PDF
基于原子设计理论的车载智能语音交互设计方法初探
11
作者 刘学 廖子岑 《创意与设计》 2024年第4期46-52,共7页
本文根据当前智能座舱以及智能语音交互技术与特征,引入原子设计理论,梳理了原子设计及设计系统相关理论中的重要概念,并将相关理论的核心框架与智能语音交互场景相融合,在语音交互背景下对原子设计理论中的要素层次进行了重新诠释和定... 本文根据当前智能座舱以及智能语音交互技术与特征,引入原子设计理论,梳理了原子设计及设计系统相关理论中的重要概念,并将相关理论的核心框架与智能语音交互场景相融合,在语音交互背景下对原子设计理论中的要素层次进行了重新诠释和定义,提出了基于原子设计的车载语音交互设计系统构建方法,为解决车载语音交互体验一致性,提升语音交互技能的设计与开发效率提供了新的思路和参考。 展开更多
关键词 语音交互设计 原子设计 车载智能语音
下载PDF
戴口罩语音与正常语音同一认定的实验研究
12
作者 邢国进 王虹 《警察技术》 2024年第3期52-56,共5页
为探究戴口罩语音与正常语音声纹特征的变化情况,实验在语音同一认定的基础上,选取了5位男性发音人和5位女性发音人在正常状态下,分别佩戴医用外科口罩、KN95口罩时发音的语音样本,分析比较后发现,佩戴医用外科口罩和KN95口罩时共振峰... 为探究戴口罩语音与正常语音声纹特征的变化情况,实验在语音同一认定的基础上,选取了5位男性发音人和5位女性发音人在正常状态下,分别佩戴医用外科口罩、KN95口罩时发音的语音样本,分析比较后发现,佩戴医用外科口罩和KN95口罩时共振峰走向、共振峰强度、共振峰频率、音节内过渡音征、音节间过渡音征、鼻音特征等声学特征均会受到一定程度的影响,尤其是鼻音特征会受到较大影响,因此在进行戴口罩语音与正常语音同一认定时应谨慎对待。 展开更多
关键词 声纹检验 语音同一认定 戴口罩语音 正常语音
下载PDF
语音学的四阶历程
13
作者 朱晓农 《常熟理工学院学报》 2024年第1期24-46,共23页
语音学已成长为一门包括众多交叉性学科的大学科,其核心分科叫语言语音学,即以实验手段研究跟语言相关的语音问题。从认识论来看,语音学经历了四个时期。它诞生于1880年代,刚开始是为语音教学和语音描写服务的,它运用实地调查和语音实... 语音学已成长为一门包括众多交叉性学科的大学科,其核心分科叫语言语音学,即以实验手段研究跟语言相关的语音问题。从认识论来看,语音学经历了四个时期。它诞生于1880年代,刚开始是为语音教学和语音描写服务的,它运用实地调查和语音实验的研究方法,实验数据被认为是可靠知识的来源。实验语音学在1940年代正式登场,这是第二期的开始。此后数十年,它在语言学外发展出很多交叉学科;但在语言学内受到排斥,语音数据被认为是无用或无关的。第三期从1990年代开始,语言语音学和实验音法学重新强调实验的重要性。到2010年代,电脑技术的进步促进了实验语音学的普及,语音学在认识论上走向依赖语音数据。最近十几年来,认识论再次转向,实验数据被认为是有用的,但起辅助作用。语言语音学应隶属、服从、服务于语言学,应为音法范畴的确立提供证据。现有的语音学基本概念都来自欧洲音素优势型语言,它们对声调和发声态无能为力。要建立一套真正的普适理论,需要全面了解亚非美洲的发声活跃型语言。近年来,国内大规模的田野调查揭示了很多过去未知的发声态和声调现象,由此发展出一个更为一般的语音学基本框架,并建立起音法类型学和演化音法学。 展开更多
关键词 现代语音 实验语音 语言语音 音法学 发声态 音法类型学 演化音法学
下载PDF
基于语音节奏差异的情感识别方法 被引量:1
14
作者 张家豪 章昭辉 +1 位作者 严琦 王鹏伟 《计算机科学》 CSCD 北大核心 2024年第4期262-269,共8页
语音情感识别在金融反欺诈等领域有着重要的应用前景,但是语音情感识别的准确率提升变得越来越困难。现有基于语谱图的语音情感识别等方法难以捕捉节奏差异特征,从而影响识别效果。文中基于语音节奏特征的差异性,提出了能量帧时频融合... 语音情感识别在金融反欺诈等领域有着重要的应用前景,但是语音情感识别的准确率提升变得越来越困难。现有基于语谱图的语音情感识别等方法难以捕捉节奏差异特征,从而影响识别效果。文中基于语音节奏特征的差异性,提出了能量帧时频融合的语音情感识别方法。其关键是,针对语音中高能量区域进行频谱筛选,以高能语音帧的分布和时频变化来体现个体的语音节奏差异。在此基础上建立基于卷积神经网络(CNN)和循环神经网络(RNN)的情感识别模型,实现对频谱的时域和频域变化特征的提取与融合。在公开数据集IEMOCAP上进行实验,结果表明,该基于语音节奏差异的语音情感识别与基于语谱图的方法相比,在加权准确率WA和非加权准确率UA指标上分别平均提升了1.05%和1.9%;同时也表明个体的语音节奏差异对提升语音情感识别效果具有重要作用。 展开更多
关键词 语音情感识别 能量帧 频域谱线 时频融合 语音节奏差异
下载PDF
语音助手中的情感计算
15
作者 岳鹏程 李太豪 《张江科技评论》 2024年第1期18-20,共3页
Siri、小爱同学、车载语音助手等已经成为人们生活中的重要角色,情感计算可以进一步提升语音助手的智能水平,使用户拥有更真实、自然的交互体验。语音助手是一种智能的人机交互系统,它可以通过语音识别、自然语言理解、语音合成等技术... Siri、小爱同学、车载语音助手等已经成为人们生活中的重要角色,情感计算可以进一步提升语音助手的智能水平,使用户拥有更真实、自然的交互体验。语音助手是一种智能的人机交互系统,它可以通过语音识别、自然语言理解、语音合成等技术实现与用户的自然对话。 展开更多
关键词 情感计算 自然语言理解 人机交互系统 语音合成 语音识别 智能水平 交互体验 语音助手
下载PDF
语音云平台在智能家居中的应用
16
作者 王庆华 林家鹏 《信息与电脑》 2024年第9期118-120,共3页
人工智能语音交互是一种极具高效、人性化和普众化的人机交互方式,能极大地提高用户体验、节省学习成本。本文以语音关键技术为切入点,介绍了通用语音云平台的构成、模型库的训练原理。基于智能家居的应用场景,以讯飞语音平台为例,阐述... 人工智能语音交互是一种极具高效、人性化和普众化的人机交互方式,能极大地提高用户体验、节省学习成本。本文以语音关键技术为切入点,介绍了通用语音云平台的构成、模型库的训练原理。基于智能家居的应用场景,以讯飞语音平台为例,阐述了智能机器人+语音云架构和以语音云平台配置语音芯片SU-03T两种方案的应用场景和工作原理。 展开更多
关键词 语音 语音识别 语音合成 智能家居
下载PDF
人工智能语音新闻研究
17
作者 贺喜格图 《数字传媒研究》 2024年第7期11-15,共5页
本文介绍人工智能语音新闻的内涵和应用价值,分析语音合成技术和语音识别技术在新闻领域的应用以及人工智能语音新闻产品和平台的现状,讨论了人工智能语音新闻存在的问题,包括语音合成的自然度和表达能力、语音识别的准确性和适应性以... 本文介绍人工智能语音新闻的内涵和应用价值,分析语音合成技术和语音识别技术在新闻领域的应用以及人工智能语音新闻产品和平台的现状,讨论了人工智能语音新闻存在的问题,包括语音合成的自然度和表达能力、语音识别的准确性和适应性以及用户体验和个性化需求的挑战。在此基础上提出了优化人工智能语音新闻的对策和建议,包括提升语音合成技术的自然度和表达能力、提高语音识别技术的准确性和适应性,以及个性化推荐和定制化服务。 展开更多
关键词 人工智能语音新闻 语音合成 语音识别 个性化推荐
下载PDF
基于多尺度时序感知网络的课堂语音情感识别方法
18
作者 周菊香 刘金生 +2 位作者 甘健侯 吴迪 李子杰 《计算机应用》 CSCD 北大核心 2024年第5期1636-1643,共8页
语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂... 语音情感识别近年来在多场景智能系统中得到了广泛应用,也为实现智慧课堂环境下的教学行为智能分析提供了可能。通过课堂语音情感识别技术可以自动识别课堂教学中教师和学生的情感状态,帮助教师了解自己的授课风格并及时掌握学生的课堂学习状态,从而达到精准施教的目的。针对课堂语音情感识别任务,首先,收集中小学的课堂实录教学视频,提取音频并进行人工切分和标注,构建了包含6类情感的中小学教学语音情感语料库;其次,基于时序卷积网络(TCN)和交叉门控机制(cross-gated mechanism)设计了双路时序卷积通道,以提取多尺度交叉融合特征;最后,采用动态权重融合策略调整不同尺度特征的贡献度,减少非重要特征对识别结果的干扰,进一步增强模型的表征和学习能力。实验结果表明,所提方法在多个公共数据集上优于TIM-Net(Temporal-aware bI-direction Multi-scaleNetwork)、GM-TCNet(Gated Multi-scale Temporal Convolutional Network)和CTL-MTNet(CapsNet and Transfer Learning-based Mixed Task Net)等先进模型,在真实课堂语音情感识别任务上未加权平均召回率(UAR)和加权平均召回率(WAR)分别达90.58%和90.45%。 展开更多
关键词 语音情感识别 课堂语音 时序卷积网络 交叉门控卷积 梅尔频率倒谱系数
下载PDF
腭裂患者异常语音感知中枢神经响应的初步研究
19
作者 白云 刘绍伟 +7 位作者 朱孟贤 汪彬昺 李盛 孟黎平 施星辉 陈霏 姜成惠 江宏兵 《口腔医学》 CAS 2024年第2期94-99,共6页
目的 基于任务态功能性磁共振成像技术(functional magnetic resonance imaging,fMRI),研究腭裂患者感知异常语音的神经激活模式。方法 采用组块设计,在16例腭裂患者和20名正常听者执行声门停顿音、高鼻音、正常语音三类听觉刺激的感知... 目的 基于任务态功能性磁共振成像技术(functional magnetic resonance imaging,fMRI),研究腭裂患者感知异常语音的神经激活模式。方法 采用组块设计,在16例腭裂患者和20名正常听者执行声门停顿音、高鼻音、正常语音三类听觉刺激的感知任务时,进行功能性磁共振扫描,统计分析腭裂组和正常组在感知不同语音刺激时脑激活模式的差异。结果 (1)腭裂组与正常组在感知声门停顿音时,右侧额中回出现显著的激活差异(FDR校正,P<0.05);(2)腭裂组在不同语音刺激下,脑激活反应存在差异,声门停顿音在右侧梭状回、枕上回、颞中回、颞上回、角回和中央前回等脑区的激活反应显著高于其他语音刺激(FDR校正,P<0.05)。结论 腭裂组与正常组在感知以声门停顿音为例的异常语音时,其神经激活模式存在显著差异,出现显著的右侧半球言语相关脑区激活,提示腭裂患者可能存在言语功能的代偿反应。 展开更多
关键词 FMRI 腭裂语音 语音感知 声门停顿音 高鼻音
下载PDF
基于双分支注意力U-Net的语音增强方法 被引量:1
20
作者 曹洁 王宸章 +2 位作者 梁浩鹏 王乔 李晓旭 《计算机应用研究》 CSCD 北大核心 2024年第4期1112-1116,共5页
针对语音增强网络对全局语音相关特征提取困难、对语音局部上下文信息的捕捉效果不佳的问题,提出了一种基于双分支注意力U-Net的时域语音增强方法,该方法使用U-Net编码器-解码器结构,将单通道带噪语音经过一维卷积后得到的高维时域特征... 针对语音增强网络对全局语音相关特征提取困难、对语音局部上下文信息的捕捉效果不佳的问题,提出了一种基于双分支注意力U-Net的时域语音增强方法,该方法使用U-Net编码器-解码器结构,将单通道带噪语音经过一维卷积后得到的高维时域特征作为输入。首先利用残差连接设计了基于Conformer的残差卷积来增强网络降噪的能力。其次设计了双分支注意力机制结构,利用全局和局部注意力获取带噪语音中更丰富的上下文信息,同时有效表示长序列特征,提取更多样的特征信息。最后结合时域频域损失函数构建了加权损失函数对网络进行训练,提高网络的语音增强性能。使用了多个指标对增强语音的质量和可懂度等进行评价,在公开数据集Voice Bank+DEMAND上的增强后的语音感知质量(PESQ)为3.11,短时可懂度(STOI)为95%,信号失真度(CSIG)为4.44,噪声失真测(CBAK)为3.60,综合质量测度(COVL)为3.81,其中PESQ相较于SE-Conformer提高了7.6%,相较于TSTNN提高了5.1%。实验结果表明,所提方法在语音降噪的各个指标都表现出更优的实验结果,能够完成语音增强任务的相关要求。 展开更多
关键词 语音增强 双分支注意力机制 时域 单通道
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部