期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
Detecting Threats of Acoustic Information Leakage Through Fiber Optic Communications
1
作者 Vladimir V. Grishachev 《Journal of Information Security》 2012年第2期149-155,共7页
Information leaks through regular fiber optic communications is possible in the form of eavesdropping on conversations, using standard fiber optic communications as illegal measuring network. The threat of leakage of ... Information leaks through regular fiber optic communications is possible in the form of eavesdropping on conversations, using standard fiber optic communications as illegal measuring network. The threat of leakage of audio information can create any kind of irregular light emission, as well as regular light beams modulated at acoustic frequencies. For information protection can be used a means of sound insulation, filtration and noising. This paper discusses the technical possibilities of countering threats by monitoring the optical radiation to detect eavesdropping. 展开更多
关键词 Fiber OPTIC COMMUNICATIONS acoustic (speech) information LEAKAGE Channel protection of acoustic (speech) information
下载PDF
基于多维度注意力机制和复数Conformer的单通道语音增强方法
2
作者 高盛祥 莫尚斌 +2 位作者 余正涛 董凌 王文君 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期393-403,共11页
为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-... 为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-Net架构下引入复数Conformer,对语音幅度和相位的相关性进行建模;利用多维度注意力机制,构造更加丰富的特征来增强卷积层的表示能力;在残差连接中加入注意力门控机制强化重构语音的细节信息。实验结果显示,相比于深度复数卷积递归网络,SE-MDACC的客观评价指标语音质量感知评估和短时客观可懂度分别提升15.299%、1.462%,表明SE-MDACC可充分提取语音声学特征并对幅度和相位相关性进行合理建模,有效提升语音质量和可理解性。 展开更多
关键词 深度复数网络 声学特征 关联信息 多维度注意力机制 语音增强
下载PDF
基于双向长短时记忆和卷积Transformer的声学词嵌入模型
3
作者 高芸芸 赵腊生 张强 《计算机应用》 CSCD 北大核心 2024年第1期123-128,共6页
示例查询语音关键词检测中,卷积神经网络(CNN)或者循环神经网络(RNN)提取到的声学词嵌入语音信息有限,为更好地表示语音内容以及改善模型的性能,提出一种基于双向长短时记忆(Bi-LSTM)和卷积Transformer的声学词嵌入模型。首先,使用Bi-L... 示例查询语音关键词检测中,卷积神经网络(CNN)或者循环神经网络(RNN)提取到的声学词嵌入语音信息有限,为更好地表示语音内容以及改善模型的性能,提出一种基于双向长短时记忆(Bi-LSTM)和卷积Transformer的声学词嵌入模型。首先,使用Bi-LSTM提取特征、对语音序列进行建模,并通过叠加方式来提高模型的学习能力;其次,为了能在捕获全局信息的同时学习到局部信息,将CNN和Transformer编码器并联连接组成卷积Transformer,充分利用它在特征提取上的优势,聚合更多有效的信息,提高嵌入的区分性。在对比损失约束下,所提模型平均精度达到了94.36%,与基于注意力的Bi-LSTM模型相比,平均精度提高了1.76%。实验结果表明,所提模型可以有效改善模型性能,更好地实现示例查询语音关键词检测。 展开更多
关键词 卷积神经网络 声学词嵌入 语音信息 示例查询语音关键词检测 循环神经网络
下载PDF
数据权利视阈下未成年人被遗忘权之立法构想
4
作者 孔丽君 《西南石油大学学报(社会科学版)》 2023年第2期71-80,共10页
在后信息社会,未成年人被遗忘权是区别于传统被遗忘权又凸显未成年人特殊保护的一项新型数字权利,在未成年人数据信息保护中扮演着不可或缺的重要角色。在法理上,未成年人被遗忘权与言论自由和隐私权均存在同质价值追求,必须给予其特殊... 在后信息社会,未成年人被遗忘权是区别于传统被遗忘权又凸显未成年人特殊保护的一项新型数字权利,在未成年人数据信息保护中扮演着不可或缺的重要角色。在法理上,未成年人被遗忘权与言论自由和隐私权均存在同质价值追求,必须给予其特殊法律保护。欧盟GDPR框架下的未成年人被遗忘权的抽象保护模式与美国COPPA、DNTKA以及加州第568号法案映射出的未成年人被遗忘权的特殊保护模式各有特点,我国的相关立法规定则较为零散、模糊。我国可以从总体原则、主体范围、权义内容以及权利行使边界等方面入手,辩证地分解和剖析欧盟、美国的立法经验,将适于中国法律土壤的部分进行本土化移植,制定出具有中国特色的未成年人数据权利保护立法。 展开更多
关键词 未成年人 数据权利 数字被遗忘权 信息保护 言论自由
下载PDF
基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究 被引量:6
5
作者 颜龙 刘刚 郭军 《中文信息学报》 CSCD 北大核心 2006年第2期60-65,共6页
本文提出一种基于小波分析的大词汇汉语连续语音识别的方法,即采用一维小波变换将原始语音信号进行五层小波分解,然后对各层小波系数进行重构,得到五层语音信号,分别对各层语音信号进行训练,得到各层的声学模型,然后结合语言模型对各层... 本文提出一种基于小波分析的大词汇汉语连续语音识别的方法,即采用一维小波变换将原始语音信号进行五层小波分解,然后对各层小波系数进行重构,得到五层语音信号,分别对各层语音信号进行训练,得到各层的声学模型,然后结合语言模型对各层声学模型的性能进行测试。通过对纯净语音和带噪语音的各层重构语音数据进行测试。结果表明对于含有高斯白噪声的带噪语音,该方法能使系统性能有所提高,但对于粉红噪声,该方法效果不明显。对于含有真实环境噪声的带噪语音,该方法能获得比基线系统更好的性能。 展开更多
关键词 计算机应用 中文信息处理 大词汇连续语音识别 小波分析 声学模型
下载PDF
维吾尔语元音的声频特性分析和识别 被引量:10
6
作者 王昆仑 张贯虹 吐尔洪江.阿布都克力木 《中文信息学报》 CSCD 北大核心 2010年第2期122-128,共7页
维吾尔语属阿尔泰语系突厥语族,由于其构词法的特点,八个元音的声频特性在语音识别中,尤其是识别基元选取中有重要作用,其共振峰频率参数也是语音识别和语音合成的重要依据。运用实验语音学的基本理论和方法,在维吾尔语综合语音数据库... 维吾尔语属阿尔泰语系突厥语族,由于其构词法的特点,八个元音的声频特性在语音识别中,尤其是识别基元选取中有重要作用,其共振峰频率参数也是语音识别和语音合成的重要依据。运用实验语音学的基本理论和方法,在维吾尔语综合语音数据库的办公环境语料条件下,对维吾尔语八个元音进行了声频特性统计分析,给出了维吾尔语元音共振峰频率参数和分布规律,并通过八个元音的语音识别实验结果,验证了其共振峰频率分布规律的正确性。实验证明:维吾尔语在排除元音和谐情况下,其声频特性具有很强的可区分性,对于实现语音信息的传送接受正确性很高。 展开更多
关键词 计算机应用 中文信息处理 语音识别 声频特性 共振峰频率 元音 维吾尔语
下载PDF
基于遗传算法的声学模型拓扑结构优化 被引量:6
7
作者 包希日莫 高光来 张璟 《计算机工程与应用》 CSCD 2014年第14期5-8,63,共5页
针对当前创建语音识别系统时只能采用经验式或启发式方法选择声学模型拓扑结构的情形,提出了一个基于标准遗传算法的声学模型拓扑结构优化算法。与以往的类似应用相比,该算法具备同时优化模型状态数与各状态高斯核数和摒弃高斯核均匀分... 针对当前创建语音识别系统时只能采用经验式或启发式方法选择声学模型拓扑结构的情形,提出了一个基于标准遗传算法的声学模型拓扑结构优化算法。与以往的类似应用相比,该算法具备同时优化模型状态数与各状态高斯核数和摒弃高斯核均匀分配的特点。连续数字串TIDigits语料上的以贝叶斯信息准则为目标函数的实验表明,与传统方法创建的基线系统相比,模型拓扑优化的系统能够以较低的复杂度获得较高的识别率,这说明该算法是声学模型拓扑结构优化的有效工具。 展开更多
关键词 隐马尔可夫模型 遗传算法 语音识别 声学模型拓扑结构 贝叶斯信息准则
下载PDF
增加电极位置信息的电子耳蜗听觉仿真模型 被引量:2
8
作者 关添 宫琴 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2010年第1期128-132,共5页
为了改进以正弦信号合成的电子耳蜗听觉仿真模型在仿真电子耳蜗植入患者所感知的语音信息的缺陷,建立了增加电极位置信息的正弦信号合成的听觉仿真模型.通过大样本量的不同汉语语言材料的听觉仿真实验,其中包括按元音、辅音、数字、音... 为了改进以正弦信号合成的电子耳蜗听觉仿真模型在仿真电子耳蜗植入患者所感知的语音信息的缺陷,建立了增加电极位置信息的正弦信号合成的听觉仿真模型.通过大样本量的不同汉语语言材料的听觉仿真实验,其中包括按元音、辅音、数字、音调和单字词等5种汉语语言材料,研究了基于连续交叉采样算法的不同实验条件下电极位置对言语识别率的影响,得出了汉语元音和单字词对植入深度更加敏感的结论.为进一步将这一仿真模型应用到电子耳蜗研究上奠定了基础. 展开更多
关键词 电子耳蜗 听觉仿真模型 语音信号处理 电极位置信息
下载PDF
基于多元激励的高质量语音合成声学模型 被引量:1
9
作者 陶建华 康永国 《中文信息学报》 CSCD 北大核心 2004年第3期73-80,共8页
传统的参数语音合成系统 ,多采用单纯的源滤波模型 ,缺少变化 ,通常导致在韵律变化较大或生成特定语气时 ,音质损伤较大。本文则在语音逆滤波过程的基础上 ,对声源在不同韵律特征和音色条件下的变化进行了仔细的比较分析 ,通过声源的重... 传统的参数语音合成系统 ,多采用单纯的源滤波模型 ,缺少变化 ,通常导致在韵律变化较大或生成特定语气时 ,音质损伤较大。本文则在语音逆滤波过程的基础上 ,对声源在不同韵律特征和音色条件下的变化进行了仔细的比较分析 ,通过声源的重构、分类 ,进而形成了适用于多种韵律特征和音色特征的多元激励(Multi-Source ,MS)模型。在此基础构建了基于多元激励的语音合成的声学模型 ,在一定意义上较大的提高了语音合成在大范围语气变化中的合成质量 ,对个性化语音合成 ,以及超小型语音合成系统的建立起到了较好的推动作用。 展开更多
关键词 计算机应用 中文信息处理 语音合成 声学模型 声源 多元激励
下载PDF
普通话广播语音的多层次标注与检索 被引量:3
10
作者 章森 华绍和 《中文信息学报》 CSCD 北大核心 2007年第4期97-104,共8页
广播语音的自动识别、标注、检索等是涉及到语音技术、自然语言处理、信息检索等多个领域的综合性课题。在介绍了广播语音的自动标注与检索的研究概况并分析了其中涉及的关键技术基础上,提出了面向普通话广播语音的多层次自动标注框架... 广播语音的自动识别、标注、检索等是涉及到语音技术、自然语言处理、信息检索等多个领域的综合性课题。在介绍了广播语音的自动标注与检索的研究概况并分析了其中涉及的关键技术基础上,提出了面向普通话广播语音的多层次自动标注框架以及基于多层次标注的语音检索方案,对文档层、句子层和词语层的标注属性进行了探讨,采用了递归标注方法对属性逐层细化,并讨论了对语音自动标注至关重要的语音识别引擎和语音流分割等问题。基于本文提出的方法,对10小时的普通话广播语音资料进行了标注和检索,得到了比较满意的实验结果。 展开更多
关键词 计算机应用 中文信息处理 广播语音 自动标注 语音检索 声学模型 语言模型
下载PDF
基于BIC与PSO的简约语音识别系统创建 被引量:1
11
作者 包希日莫 高光来 张璟 《计算机工程与应用》 CSCD 2013年第10期14-17,117,共5页
针对当前尚无建立简约高效语音识别系统标准方法的情形,提出了通过贝叶斯信息准则(Bayesian InformationCriterion,BIC)中的权衡系数折中选择系统识别率与复杂度,利用改进的粒子群优化(Particle Swarm Optimization,PSO)算法优化声学模... 针对当前尚无建立简约高效语音识别系统标准方法的情形,提出了通过贝叶斯信息准则(Bayesian InformationCriterion,BIC)中的权衡系数折中选择系统识别率与复杂度,利用改进的粒子群优化(Particle Swarm Optimization,PSO)算法优化声学模型拓扑结构,进而创建高效简约语音识别系统的新方法。TIDigits上的实验表明,与传统方法创建的同复杂度的基线系统相比,用该方法建立的新系统句子正确率提升了7.85%,与同识别率的基线系统相比,系统复杂度降低了51.4%,说明新系统能够以较低的复杂度获得较高的识别率。 展开更多
关键词 隐马尔可夫模型 语音识别 高效简约系统 声学模型拓扑结构 贝叶斯信息准则 粒群优化
下载PDF
语言声学与内容理解研究进展 被引量:1
12
作者 颜永红 《应用声学》 CSCD 北大核心 2012年第1期35-41,共7页
本文对语言声学与内容理解研究的最新进展进行综述。首先介绍人类的言语的产生、感知以及声学分析方面的进展,接着分别介绍采用计算机来对语音中的各种信息进行抽取(包括语音、说话人和语种识别)和内容分析与理解(包括文档内容分析和理... 本文对语言声学与内容理解研究的最新进展进行综述。首先介绍人类的言语的产生、感知以及声学分析方面的进展,接着分别介绍采用计算机来对语音中的各种信息进行抽取(包括语音、说话人和语种识别)和内容分析与理解(包括文档内容分析和理解与对话)的最新成果,最后对语言声学与内容理解的研究进行了总结和展望。 展开更多
关键词 语言声学 语音信息提取 口语内容理解
下载PDF
语音段中朝蒙单元音概率分布的对比分析 被引量:1
13
作者 王桂荣 金小峰 《延边大学学报(自然科学版)》 CAS 2018年第3期260-265,共6页
为了从声学语音学角度比对朝鲜语与蒙古语的相似性,提出了一种利用相似单元音在连续语音段中出现的概率分布来对比分析语音相似程度的方法.首先,采用双门限静音段检测方法将连续语音自动划分为一系列的语音段,然后采用模式识别方法检测... 为了从声学语音学角度比对朝鲜语与蒙古语的相似性,提出了一种利用相似单元音在连续语音段中出现的概率分布来对比分析语音相似程度的方法.首先,采用双门限静音段检测方法将连续语音自动划分为一系列的语音段,然后采用模式识别方法检测和统计5对相似单元音在语音段首、段中和段尾的概率分布,最后通过对比分析概率分布比较了朝鲜语和蒙古语的语音相似性.对比分析结果表明,朝鲜语与蒙古语语音之间存在差异性,这两种语音的声学特征不具有相似性.本文研究方法和结果可为进一步研究朝鲜语与蒙古语的语音对比提供参考. 展开更多
关键词 语音信息处理 声学语音学 语音对比分析 语音相似性度量 静音段检测
下载PDF
不等保护能力纠错编码在水声信息传输中应用的研究 被引量:1
14
作者 许祥滨 《海洋技术》 北大核心 2002年第3期67-71,共5页
通过分析水声信道的特性和水声信息源的特点 ,结合信道编码理论与技术的最新进展 ,提出了一种全新的、能适合于水声信息传输的、高性能的不等保护能力纠错编解码方法。
关键词 纠错 编码 TURBO码 码率 删余 不等保护能力 水声信息传输 解码
下载PDF
连续语音识别中声学建模的组合聚类算法研究 被引量:5
15
作者 韩兆兵 贾磊 +1 位作者 张树武 徐波 《中文信息学报》 CSCD 北大核心 2003年第4期33-38,共6页
基于三音子连续语音识别的一个关键问题是在有限训练数据的条件下对大量声学模型参数的鲁棒性估计。为了解决这个问题 ,有两个主要的上下文相关的聚类算法被提出 ,它们是合并 (AgglomerativeClustering)聚类 (AGG)和决策树 (Tree based... 基于三音子连续语音识别的一个关键问题是在有限训练数据的条件下对大量声学模型参数的鲁棒性估计。为了解决这个问题 ,有两个主要的上下文相关的聚类算法被提出 ,它们是合并 (AgglomerativeClustering)聚类 (AGG)和决策树 (Tree based)聚类 (TB)。本文分析了这两种算法的优缺点 ,并分别对其进行了改进 ,然后提出了最大似然框架下组合聚类算法。大词汇量连续语音识别 (LVCSR)的实验结果表明 ,和单一的决策树聚类算法比较 ,提出的组合聚类算法对识别率有显著的提高。 展开更多
关键词 连续语音识别 声学建模 组合聚类算法 合并聚类 决策树聚类 鲁棒性估计
下载PDF
汉英双语混合声学建模方法研究 被引量:4
16
作者 于胜民 张树武 徐波 《中文信息学报》 CSCD 北大核心 2004年第5期78-84,共7页
本文从直接合并汉英双语的 phoneset入手 ,对三种不同的汉英双语混合声学建模方法进行了研究。这三种方法分别是 :(1)直接合并二者的 phoneset进行声学建模 ;(2 )基于IPA映射的统一声学表示 ;(3)对汉英双语的Phone进行自动合并聚类。实... 本文从直接合并汉英双语的 phoneset入手 ,对三种不同的汉英双语混合声学建模方法进行了研究。这三种方法分别是 :(1)直接合并二者的 phoneset进行声学建模 ;(2 )基于IPA映射的统一声学表示 ;(3)对汉英双语的Phone进行自动合并聚类。实验结果表明 ,方法 (1)的声学模型较为鲁棒 ,但是建模单元也最多 ,模型不够紧凑 ;方法 (2 )具有紧凑的模型 ,但是鲁棒性较差 ;方法 (3)以较少的Phone进行双语混合声学建模 ,不仅保持了 (2 )中模型紧凑的特点 ,而且基本达到 (1)的识别率 ;特别是当使用声学似然度准则时 ,英语的识别率甚至超过了方法 (1) 展开更多
关键词 计算机应用 中文信息处理 语音识别 声学建模 汉语双语 合并聚类 似然度
下载PDF
汉语连续语音中HMM模型状态数优化方法研究 被引量:7
17
作者 何珏 刘加 《中文信息学报》 CSCD 北大核心 2006年第6期83-88,共6页
为了优化汉语连续语音中HMM模型系统以提高识别性能,提出了分别为每个声母和韵母半音节声学模型选择最优的状态数的方法。通过综合考虑每个声母和韵母半音节声学模型在不同状态数下的段长均值、方差以及各自识别率这三者信息,作为进行... 为了优化汉语连续语音中HMM模型系统以提高识别性能,提出了分别为每个声母和韵母半音节声学模型选择最优的状态数的方法。通过综合考虑每个声母和韵母半音节声学模型在不同状态数下的段长均值、方差以及各自识别率这三者信息,作为进行最优模型状态数的选择准则。优化后的声学模型系统由状态数各不相同的声母半音节声学模型组成,同未优化前状态数统一的模型系统相比,音节识别性能提高了5.07个百分点。研究表明,每个声母和韵母半音节志学模型应根据情况选择不同的状态数,优化后的模型系统识别性能得到了提高。 展开更多
关键词 计算机应用 中文信息处理 声学模型 隐型Markov模型 语音识别
下载PDF
维吾尔语双音节词韵律特征声学分析 被引量:12
18
作者 祖丽皮亚.阿曼 艾斯卡尔.艾木都拉 《中文信息学报》 CSCD 北大核心 2009年第5期104-107,共4页
该文从文本分析模块入手,利用"维吾尔语语音声学参数库",选择了以开音节和闭音节结尾的969个双音节词的韵律参数,包括元音时长、音高和音强进行了统计分析,归纳了其元音时长、音高和音强分布模式,探讨了维吾尔语双音节词的韵... 该文从文本分析模块入手,利用"维吾尔语语音声学参数库",选择了以开音节和闭音节结尾的969个双音节词的韵律参数,包括元音时长、音高和音强进行了统计分析,归纳了其元音时长、音高和音强分布模式,探讨了维吾尔语双音节词的韵律节奏模式与双音节词重音之间的关系问题,其目的是为了提高语音合成的自然度。我们相信本项研究对维吾尔语语言乃至整个阿尔泰语系语言的韵律研究具有较高的参考价值。 展开更多
关键词 计算机应用 中文信息处理 语音合成 中文信息处理 维吾尔语 韵律特征 声学分析
下载PDF
一种基于区分性准则的模型结构优化方法 被引量:1
19
作者 鄢志杰 胡郁 王仁华 《中文信息学报》 CSCD 北大核心 2008年第2期99-105,共7页
本文提出了一种基于区分性准则的模型结构优化方法,用以调整HMM自动语音识别系统中声学模型各状态混合高斯核成分数量的分配。通过优化选定的准则,声学模型可以在使用相同参数数量的情况下得到更好的识别性能,也可以在保持相当性能的前... 本文提出了一种基于区分性准则的模型结构优化方法,用以调整HMM自动语音识别系统中声学模型各状态混合高斯核成分数量的分配。通过优化选定的准则,声学模型可以在使用相同参数数量的情况下得到更好的识别性能,也可以在保持相当性能的前提下降低所需要的模型参数。相对于传统的基于似然度及复杂度惩罚的模型结构优化准则来讲,基于区分性准则的优化方法能够更直接地提高模型的区分度和鉴别力,从而得到更好的识别效果。在一个面向嵌入式系统的中文连续数字串识别任务上的实验结果证明,基于最大互信息量准则的模型结构优化能够得到比传统的、基于模型似然度及复杂度的方法更好的识别效果。 展开更多
关键词 计算机应用 中文信息处理 自动语音识别 声学模型 模型结构优化
下载PDF
智能语音系统安全分析 被引量:1
20
作者 张笑宇 沈超 +2 位作者 陈宇飞 吴星辉 刘畅 《数据与计算发展前沿》 2019年第2期98-109,共12页
【目的】智能语音系统的发展推动着人类生活的进步,人机之间实现便捷沟通的同时也暴露出了各种安全问题。本文对智能语音系统安全的研究现状进行全面的介绍,为中国相关研究工作开展提供参考。【文献范围】参考文献选自人工智能系统安全... 【目的】智能语音系统的发展推动着人类生活的进步,人机之间实现便捷沟通的同时也暴露出了各种安全问题。本文对智能语音系统安全的研究现状进行全面的介绍,为中国相关研究工作开展提供参考。【文献范围】参考文献选自人工智能系统安全领域的国内外期刊和会议,总计50余篇。【方法】通过对智能语音系统安全相关研究进行介绍,从智能语音系统的各个环节入手,分析了该领域国内外研究现状以及未来的研究趋势。【结果】针对智能语音系统安全的研究已经取得了相当的成果,但整体处在初级阶段,仍有方向等待探索,仍有难题等待解决。【局限】语音系统安全近年在飞速发展,受限于获取资料的时效性,文中部分研究可能已有新的进展。【结论】关于语音系统安全的研究具备高度的实用价值,但现有的研究在研究角度、实用性等方面存在局限,仍存在大量的空白区域等待学者们进一步探索、研究。 展开更多
关键词 智能语音系统 信息安全 隐私保护
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部