期刊文献+
共找到300篇文章
< 1 2 15 >
每页显示 20 50 100
面向实时通信的语音数据隐私保护系统设计与实现
1
作者 牛犇 孔甜甜 +3 位作者 周泽峻 刘圣龙 黄秀丽 江伊雯 《网络空间安全科学学报》 2024年第3期53-66,共14页
语音通信已成为人们生活中不可或缺的一部分,但其中蕴含的语义、声纹等隐私数据也面临严重泄露风险。提出一种面向实时通信的语音数据隐私保护方法,从语义内容与声纹特征两个维度进行实时语音数据的隐私保护。该方法采用语音识别技术,... 语音通信已成为人们生活中不可或缺的一部分,但其中蕴含的语义、声纹等隐私数据也面临严重泄露风险。提出一种面向实时通信的语音数据隐私保护方法,从语义内容与声纹特征两个维度进行实时语音数据的隐私保护。该方法采用语音识别技术,实现了文本域上的语义内容脱敏工作。在通过计算文本嵌入向量间的相似度推断敏感词信息的基础上,用户可以通过指定敏感词来实现个性化隐私保护。同时,该方法结合了基于语义相似度与随机字符两种方式将敏感内容替换为安全词的语义内容脱敏算法,并基于深度学习模型的语音合成技术与语音引擎两种方式实现了声纹特征的匿名化处理。实验证明,该方法支持根据隐私级别与时间开销选择语义脱敏和声纹匿名;尤其当获取语音识别结果的时间在原本时间的30%~50%之间时,可以较好地平衡识别准确度与时间开销。 展开更多
关键词 语音数据 隐私保护 语音识别 语义脱敏 语音合成
下载PDF
普通话多模态情感语音数据库构建与评测
2
作者 李良琦 张雪英 +3 位作者 段淑斐 肖仲喆 贾海蓉 梁慧芝 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期18-31,共14页
本文设计并建立了一个包含发音运动学、声学、声门和面部微表情的多模态情感语音汉语普通话数据库,分别从语料设计、被试选择、录制细节和数据处理等环节进行了详细的描述,其中信号被标记为离散情感标签(中性、愉悦、高兴、冷漠、愤怒... 本文设计并建立了一个包含发音运动学、声学、声门和面部微表情的多模态情感语音汉语普通话数据库,分别从语料设计、被试选择、录制细节和数据处理等环节进行了详细的描述,其中信号被标记为离散情感标签(中性、愉悦、高兴、冷漠、愤怒、忧伤、悲痛)和维度情感标签(愉悦度、激活度、优势度)。本文对维度标注的数据进行统计学分析,验证标注的有效性,同时验证标注者的SCL-90量表数据并与PAD标注数据结合后进行分析,探究标注中存在的离群现象与标注者心理状况之间的内在联系。为验证该数据库的语音质量和情感区分度,本文使用SVM、CNN、DNN3种基础模型计算了7种情感的识别率。结果显示,单独使用声学数据时7种情感的平均识别率达到了82.56%;单独使用声门数据时平均识别率达到了72.51%;单独使用运动学数据时平均识别率也达到了55.67%。因此,该数据库具有较高的质量,能够作为语音分析研究的重要来源,尤其是多模态情感语音分析的任务。 展开更多
关键词 情感语音数据 多模态情感识别 维度情感空间 三维电磁发音仪 电子声门仪
下载PDF
汉语双模情感语音数据库标注及一致性检测 被引量:7
3
作者 景少玲 毛峡 +1 位作者 陈立江 张娜娜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2015年第10期1925-1934,共10页
对缺少含有丰富情感标注信息的情感语音数据库问题,建立了一个包含语音和电声门图仪(EGG)信息的汉语双模情感语音数据库,并对其进行了标注和一致性检测.首先,根据情感语音数据库的特色制定了详细的标注规则和方法,由5名标注者按照制定... 对缺少含有丰富情感标注信息的情感语音数据库问题,建立了一个包含语音和电声门图仪(EGG)信息的汉语双模情感语音数据库,并对其进行了标注和一致性检测.首先,根据情感语音数据库的特色制定了详细的标注规则和方法,由5名标注者按照制定的标注规则对情感语音数据库进行标注.其次,为了确保情感语音数据库的标注质量和测试标注规则的完整性,标注者在正式标注之前先进行了测试性标注,测试语音包含280条语音(7种情感×2名说话人×20条语音).最后,根据语音标注规则设计了相应的一致性检测算法.结果表明,在5 ms的时间误差范围内,5名标注者对相同语音标注的一致性平均可以达到60%以上,当误差范围增大至8 ms和10 ms时,一致性平均可提高5%和8%.实验说明5名标注者对语音的理解较一致,制定的标注规则比较完整,情感语音数据库的质量也较高. 展开更多
关键词 汉语 双模 情感语音数据 语音标注 一致性检测
下载PDF
一个面向语音识别的云南民族口音普通话语音数据库 被引量:3
4
作者 普园媛 杨鉴 +1 位作者 尉洪 杨惠娟 《计算机工程》 CAS CSCD 北大核心 2003年第17期87-89,共3页
介绍了一个以语音识别为目的的云南民族口音普通话语音数据库。当前,语音识别技术要走向实用必须解决用户情况多样性带来的鲁棒性问题,通常把这个问题简要地归结为“男女老幼”和“南腔北调”。作为民族文化大省的云南,共有25个少数... 介绍了一个以语音识别为目的的云南民族口音普通话语音数据库。当前,语音识别技术要走向实用必须解决用户情况多样性带来的鲁棒性问题,通常把这个问题简要地归结为“男女老幼”和“南腔北调”。作为民族文化大省的云南,共有25个少数民族,广大少数民族同胞在说普通话时明显带有地方民族口音,云南民族口音普通话语音识别研究是用户情况多样性研究的重要内容,而为之建立云南民族口音普通话语音数据库是该研究的重要基础和先决条件。 展开更多
关键词 语音数据 语音识别 民族口音
下载PDF
情感语音数据库优化及PAD情感模型量化标注 被引量:14
5
作者 张雪英 张婷 +2 位作者 孙颖 张卫 畅江 《太原理工大学学报》 北大核心 2017年第3期469-474,共6页
情感语音数据库是情感语音识别研究的基础,建立包含认知心理因素在内的维度情感语音数据库对提高识别率、改善人机交互能力具有重要意义。笔者首先对前期建立的摘引型TYUT2.0数据库进行语音听辨筛选,根据认同率阈值进行数据库优化,得到... 情感语音数据库是情感语音识别研究的基础,建立包含认知心理因素在内的维度情感语音数据库对提高识别率、改善人机交互能力具有重要意义。笔者首先对前期建立的摘引型TYUT2.0数据库进行语音听辨筛选,根据认同率阈值进行数据库优化,得到的情感语音数据库包含四种情感的语句237句,其中"悲伤"62句,"愤怒"58句,"高兴"57句,"惊奇"60句。然后利用PAD三维情感模型对该数据库语音进行标注,得到维度情感语音数据库。该数据库中的每句语音都有对应的听辨认同率以及PAD值。对每句语音的PAD值进行统计分析,证明了该维度情感语音数据库的有效性,为今后研究维度情感识别奠定了基础。 展开更多
关键词 情感语音数据 维度情感描述 PAD情感模型
下载PDF
模极大值与阈值决策融合的小波语音数据去噪方法 被引量:2
6
作者 刘健 陶玉静 张维明 《计算机应用研究》 CSCD 北大核心 2008年第10期3134-3135,3138,共3页
小波在时域、频域都具有表征信号局部特征的能力,对于语音数据的去噪,与其他方法比较具有优势,但是阈值的选择缺乏明确的指标。模极大值法保留幅度随尺度增加而增大的点(对应于有用信号的极值点)来达到去噪的目的,但将非极值处变换系数... 小波在时域、频域都具有表征信号局部特征的能力,对于语音数据的去噪,与其他方法比较具有优势,但是阈值的选择缺乏明确的指标。模极大值法保留幅度随尺度增加而增大的点(对应于有用信号的极值点)来达到去噪的目的,但将非极值处变换系数置零,造成信号损失。提出了一种变化模极大值与阈值决策相融合的去噪方法,有效地结合了两者的优点。经实验证明,该方法精度高、算法简单、计算速度快。 展开更多
关键词 小波去噪 模极大值 阈值 语音数据处理
下载PDF
基于模糊综合评价法的情感语音数据库的建立 被引量:9
7
作者 宋静 张雪英 +1 位作者 孙颖 畅江 《现代电子技术》 北大核心 2016年第13期51-54,58,共5页
为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该... 为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该模型对初选阶段的数据库进行模糊评价,筛选得到最终高质量的情感语音数据库。将三种类型的数据库用于情感语音识别实验,对比分析了不同类型数据库的差异,同时也验证了本数据库的有效性。 展开更多
关键词 情感语音数据 模糊综合评价 层次分析法 熵权法 情感语音识别
下载PDF
网上语音数据传输的Delphi实现技术 被引量:3
8
作者 蒋先刚 涂晓斌 陈海雷 《华东交通大学学报》 2002年第3期58-61,共4页
介绍并分析语音数据在网上的传递技术和应用 ,主要介绍用Delphi在网上开发语音传输程序的关键技术和技巧 。
关键词 语音数据传输 DELPHI 实现技术 音频压缩管理器 嵌套字控件 数据 网络
下载PDF
语音数据网络集成技术分析 被引量:5
9
作者 黄海明 杨宇航 诸鸿文 《上海交通大学学报》 EI CAS CSCD 北大核心 1999年第1期104-107,共4页
语音数据网络集成是迈向综合业务网络环境的第一步.通过分析比较现有语音数据网络集成技术(包括话音ATM交换、话音帧中继和语音IP交换),提出了此类应用的网络模型.在此基础上研究了实现语音数据网络集成的延时保证、带宽利用... 语音数据网络集成是迈向综合业务网络环境的第一步.通过分析比较现有语音数据网络集成技术(包括话音ATM交换、话音帧中继和语音IP交换),提出了此类应用的网络模型.在此基础上研究了实现语音数据网络集成的延时保证、带宽利用、系统效率和信令接口等关键问题。 展开更多
关键词 异步转移模式 话音交换 语音数据网络 集成技术
下载PDF
远程教学数字图书馆中基于MPEG-7的语音数据的组织索引 被引量:1
10
作者 卢坚 杨文清 +1 位作者 陈毅松 张福炎 《情报学报》 CSSCI 北大核心 2002年第4期407-412,共6页
本文提出基于MPEG 7的教学语音内容的描述模式 ,它是语音数据的层次结构化组织和多维索引的重要依据。描述模式为用户提供了层次结构的浏览视图和导航机制 ,以及反映用户多角度观察和分析的多维索引 ,从而实现互操作性的基于内容的语音... 本文提出基于MPEG 7的教学语音内容的描述模式 ,它是语音数据的层次结构化组织和多维索引的重要依据。描述模式为用户提供了层次结构的浏览视图和导航机制 ,以及反映用户多角度观察和分析的多维索引 ,从而实现互操作性的基于内容的语音检索等服务。最后本文概要地分析了特征的自动提取和描述的自动生成技术。 展开更多
关键词 远程教学 数字图书馆 MPEG-7 描述模式 层次式组织 多维索引 跨模态信息检索 教学语音数据
下载PDF
基于CH365的PCI语音数据采集卡的设计 被引量:2
11
作者 刘国锦 庄晓琼 +1 位作者 时斌 唐浩 《微计算机信息》 北大核心 2008年第5期259-260,218,共3页
PCI总线已成为当今计算机的主流总线,各种基于PCI总线的系统应运而生。语音数据采集卡就是一种以PCI总线作为接口的系统。文章对PCI总线控制专用芯片CH365的特点、本地硬件定址等功能做了详细的介绍,并简单阐述了将I/O口扩展、地址译码... PCI总线已成为当今计算机的主流总线,各种基于PCI总线的系统应运而生。语音数据采集卡就是一种以PCI总线作为接口的系统。文章对PCI总线控制专用芯片CH365的特点、本地硬件定址等功能做了详细的介绍,并简单阐述了将I/O口扩展、地址译码及本地硬件定址集成在CPLD内的实例,以及此系统在通信系统中的应用。 展开更多
关键词 PCI CH365 CPLD 语音数据采集 本地硬件定址
下载PDF
面向残疾人的汉语可视语音数据库 被引量:3
12
作者 李刚 王蒙军 林凌 《中国生物医学工程学报》 CAS CSCD 北大核心 2007年第3期355-360,388,共7页
将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特... 将人机交互领域中研究的唇读技术应用于康复工程之中,设计了一个基于视觉语言的语音合成系统。该系统特别针对后天致残,丧失语音能力的人设计,采用了一种特定条件下的汉语可视语音数据库。不同于现有的数据库,该数据库的设计具有以下特点:采用了非对称唇形轮廓模型,提取了嘴唇突出度的信息;针对汉语音节的特点,增强了汉字音节中信息变化过程;兼顾未来唇读技术的发展,以音节为基本元素,具有可扩充性。采用运动检测和数学形态学的办法提取唇动图像序列中的唇形区域,并从中提取非对称唇形轮廓模型特征参数,同时通过计算部分参数对时间的差分,来获得唇形轮廓的动态信息。基于隐马尔可夫模型的学习和识别实验表明,该数据库的设计方法合理,所选的唇动特征用能够将识别效果平均提高25%。 展开更多
关键词 唇读技术 康复工程 可视语音数据 非对称唇形轮廓模型 隐马尔可夫模型
下载PDF
汉语连续语音数据库的语料设计 被引量:17
13
作者 祖漪清 《声学学报》 EI CSCD 北大核心 1999年第3期236-247,共12页
质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持.在目前阶段,汉语语音数据库应限制在朗读言语(readspeech)的音段方面。为了描写语流中的音变现象,... 质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持.在目前阶段,汉语语音数据库应限制在朗读言语(readspeech)的音段方面。为了描写语流中的音变现象,考虑如下语音单元:(1)不计声调的音节(401个)。(2)音节间的双音子415个。(3)音节间的三音子3035个,这是根据37个基本音子,利用音节间共振峰过渡的研究结果,按规则规纳的结果.(4)所有音节间过渡段的韵母一声母结构,采用和同三音子相同的归并方法,共781个.为了增加不同的韵律结构,并考虑语音识别系统的后处理,语料还包括汉语的17类基本句型.选用1993、1994两年的“人民日报”、“百家报刊精选”及若干电视剧本、词典词库作为语料库的原始语料,从中选出2185个句子和388个短语作为朗读语料,它们覆盖了99.8%个无调音节,100%的双音子,99.6%的三音子,以及17类句型。 展开更多
关键词 汉语 语音数据 语料设计
下载PDF
传声器阵列语音数据采集系统的设计与实现 被引量:2
14
作者 陈晓峰 肖熙 《电声技术》 2008年第7期43-46,共4页
介绍了一种传声器阵列语音数据采集系统的软硬件设计方案,该系统采用USB2.0接口实时传输采集到的多通道语音数据,系统具有使用方便、容易扩展等特点。
关键词 传声器阵列 语音数据采集 USB2.0 CS5368
下载PDF
多通道同步语音数据采集系统设计分析 被引量:4
15
作者 徐文娟 张晓云 《无线电工程》 2012年第6期19-21,共3页
针对噪声污染及其控制的解决需要,为提高语音增强系统效能,介绍了一种基于数字信号处理(DSP)并口的高精度多通道同步语音数据采集系统,并对其系统结构、软硬件实现以及三路音频信号的存储器直接访问(DMA)同步采集进行了分析。该系统针... 针对噪声污染及其控制的解决需要,为提高语音增强系统效能,介绍了一种基于数字信号处理(DSP)并口的高精度多通道同步语音数据采集系统,并对其系统结构、软硬件实现以及三路音频信号的存储器直接访问(DMA)同步采集进行了分析。该系统针对实际需要而开发,结构简单,扩展方便,实时性好,多路的语音数据达到了良好的同步性,具有较高的应用与推广价值。 展开更多
关键词 语音数据采集 DSP DMA
下载PDF
中文普通话电话语音数据库的研制 被引量:2
16
作者 肖毅 李治柱 《计算机工程》 CAS CSCD 北大核心 2002年第8期204-205,231,共3页
叙述了“中文普通话电话语音数据库”的开发背景和设计,着重介绍了该语音数据库的内容、结构和特点。
关键词 中文普通话电话语音数据 语音识别 隐马尔科夫模型
下载PDF
面向移动电话应用的粤语语音数据库构建 被引量:1
17
作者 祝庆绩 钱国荣 李治柱 《计算机应用与软件》 CSCD 北大核心 2004年第7期63-65,共3页
本文介绍了一个拥有 2 0 0 0个说话者的面向移动电话应用的粤语语音数据库 ,该语音库用于电话应用方面的语音识别研究。在简单介绍本语音数据库的开发背景后 ,着重介绍了该语音库的结构、内容、特点和注释规范。
关键词 粤语语音数据 移动电话 语音识别 隐马尔可夫模型
下载PDF
维吾尔语语音数据库的手工标注及软件实现 被引量:3
18
作者 王昆仑 张晓强 王光照 《新疆师范大学学报(自然科学版)》 2001年第3期25-33,共9页
附加标注信息的语音数据库在语音识别研究中的作用十分重要。本文介绍了我们开发的维吾尔语语音数据库手工标注系统的功能及其在实现过程中采用的一些技术 。
关键词 维吾尔语 语音数据 语音标注 语音识别 手工标注系统 语音切分原理
下载PDF
论粤方言语音数据库的建设 被引量:1
19
作者 邵慧君 秦绿叶 《学术研究》 CSSCI 北大核心 2008年第4期147-150,共4页
近年来计算机技术的日新月异对学术研究方法的更新带来巨大的便利和更高的要求,本文着重探讨利用电脑来建设粤方言语音数据库的基本思路和框架,以便今后方言资料更大量而精确地保存,为进一步的理论研究如方言类型比较、方言特征的地理... 近年来计算机技术的日新月异对学术研究方法的更新带来巨大的便利和更高的要求,本文着重探讨利用电脑来建设粤方言语音数据库的基本思路和框架,以便今后方言资料更大量而精确地保存,为进一步的理论研究如方言类型比较、方言特征的地理分布研究、方言语音的数据分析等打下基础。 展开更多
关键词 粤方言 语音数据
下载PDF
实现语音数据库科学性的重要环节——篇章断句与连续语音的韵律结构 被引量:6
20
作者 祖漪清 《语言文字应用》 CSSCI 北大核心 1998年第1期95-99,共5页
本文描述了连续语音数据库的基本研制过程,提出文本设计等方面使用的语言学、语音学知识,指出在篇章的断句和连续语音的韵律结构方面还存在许多问题有待研究。
关键词 语音数据 韵律结构 连续语音识别 句法结构 语料库 连续语句 重要环节 语音合成 智能接口 语音现象
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部