期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
汉英机译系统英文生成中特殊动词短语的处理研究 被引量:1
1
作者 洪青阳 李堂秋 杨晓峰 《计算机应用研究》 CSCD 北大核心 2001年第3期27-30,共4页
主要讨论汉英两种语言特殊动词短语表示方式的不同,包括动词短语的拆分、变形和辅助成分的确定。在分析模块给出的中间语言信息不够详尽的情况下,需要生成模块针对性地作进一步处理,才能得到规范准确的译文。生成模块中一个详尽的词... 主要讨论汉英两种语言特殊动词短语表示方式的不同,包括动词短语的拆分、变形和辅助成分的确定。在分析模块给出的中间语言信息不够详尽的情况下,需要生成模块针对性地作进一步处理,才能得到规范准确的译文。生成模块中一个详尽的词典非常重要,提出的生成策略就是在一个完备的词典的基础上通过规则来实现的。 展开更多
关键词 动词短语 中间语言 汉英机译系统 英文生成 信息处理
下载PDF
采用可调波束形成器的GSC麦克风阵列语音增强方法 被引量:8
2
作者 李芳兰 周跃海 +1 位作者 童峰 洪青阳 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第2期186-189,共4页
基于广义旁瓣抵消器(generalized sidelobe canceller,GSC)算法的麦克风阵列语音增强技术已得到广泛研究,但由于其通常需传统的声源定位方法提供声源方位,语音信号信噪比(SNR)低时声源定位精度将明显下降并影响到语音增强效果.提出了一... 基于广义旁瓣抵消器(generalized sidelobe canceller,GSC)算法的麦克风阵列语音增强技术已得到广泛研究,但由于其通常需传统的声源定位方法提供声源方位,语音信号信噪比(SNR)低时声源定位精度将明显下降并影响到语音增强效果.提出了一种新的麦克风阵列语音增强方法,该方法在GSC中引入可调波束形成器估计声源方位以抑制背景噪声影响.不同类型背景噪声下的实验室语音增强结果表明了该方法的有效性. 展开更多
关键词 语音增强 麦克风阵列 可调波束形成器 广义旁瓣抵消器
下载PDF
一种可跟踪移动声源方向的麦克风阵列语音增强算法 被引量:6
3
作者 陈磊 江伟华 +1 位作者 童峰 洪青阳 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第4期551-555,共5页
麦克风阵列语音增强技术已在语音信号处理中得到广泛研究.但在智能家居等领域中,当说话人等声源移动导致声源方向相对麦克风阵列发生变化时,由此产生的信号泄露将严重影响消噪性能.本文提出了一种基于麦克风阵列进行移动声源方向跟踪和... 麦克风阵列语音增强技术已在语音信号处理中得到广泛研究.但在智能家居等领域中,当说话人等声源移动导致声源方向相对麦克风阵列发生变化时,由此产生的信号泄露将严重影响消噪性能.本文提出了一种基于麦克风阵列进行移动声源方向跟踪和噪声消除的联合算法,该方法利用两个平行滤波器组构成梯度迭代的移动声源方向跟踪器,并将该声源跟踪器嵌入广义旁瓣抵消器结构中从而进行声源方向梯度迭代跟踪和麦克风阵列语音增强的联合实现.在实验室噪声背景下移动声源的语音增强结果表明了该方法的有效性. 展开更多
关键词 语音增强 麦克风阵列 梯度迭代 广义旁瓣抵消器
下载PDF
基于概率修正PLDA的说话人识别系统 被引量:4
4
作者 李琳 万丽虹 +2 位作者 洪青阳 张君 李明 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第8期692-696,共5页
为减弱注册语音与测试语音时长不一致对说话人识别性能的负面影响,提出一个概率修正PLDA建模方法.根据语音时长自适应改变传统PLDA模型中i-vector的概率分布函数,提高PLDA对每个说话人每段语音的时长表征能力,以增强说话人类别的区分度... 为减弱注册语音与测试语音时长不一致对说话人识别性能的负面影响,提出一个概率修正PLDA建模方法.根据语音时长自适应改变传统PLDA模型中i-vector的概率分布函数,提高PLDA对每个说话人每段语音的时长表征能力,以增强说话人类别的区分度.为验证基于概率修正PLDA模型的有效性,进行了NIST SRE10 corecore测试集在3种不同时长的评测实验,以及NIST 2014 i-vector machine learning challenge测试任务.结果表明,相较于传统的PLDA训练模型,通过语音时长的约束提高了说话人识别性能. 展开更多
关键词 高斯PLDA i-vector 语音时长 概率修正 说话人识别
下载PDF
基于实例的汉语句法结构分析歧义消解 被引量:11
5
作者 杨晓峰 李堂秋 洪青阳 《中文信息学报》 CSCD 北大核心 2001年第3期22-28,共7页
本文论述了一种基于实例的汉语句法结构分析的消歧方法。本文首先提出了这种方法的总体思路 ,并对其语义知识资源—《知网》作了简要的介绍。然后详细地描述了基于实例的排歧法的主要算法。最后给出的算法实验结果例子证明 ,这种方法是... 本文论述了一种基于实例的汉语句法结构分析的消歧方法。本文首先提出了这种方法的总体思路 ,并对其语义知识资源—《知网》作了简要的介绍。然后详细地描述了基于实例的排歧法的主要算法。最后给出的算法实验结果例子证明 ,这种方法是对汉语的结构分析排歧是有效的。 展开更多
关键词 歧义消解 基于实例 相似度 依存关系树 自动句法分析 汉语
下载PDF
采用DTW算法和语音增强的嵌入式声纹识别系统 被引量:2
6
作者 周跃海 童峰 洪青阳 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2012年第2期174-178,共5页
动态时间规整(dynamic time warping,DTW)是一种相对简单成熟的算法,广泛用于语音识别系统中.针对环境噪声对声纹识别系统性能的影响,用信噪比关联谱减及自适应门限端点检测进行抗噪声处理,在此基础上采用DTW算法设计了基于嵌入式ARM9... 动态时间规整(dynamic time warping,DTW)是一种相对简单成熟的算法,广泛用于语音识别系统中.针对环境噪声对声纹识别系统性能的影响,用信噪比关联谱减及自适应门限端点检测进行抗噪声处理,在此基础上采用DTW算法设计了基于嵌入式ARM9平台的声纹识别实现方案,并给出了带噪环境下的声纹识别实验结果. 展开更多
关键词 声纹识别 动态时间规整 谱减 嵌入式系统
下载PDF
汉英翻译系统英文生成中选词模型的设计 被引量:1
7
作者 陈毅东 李堂秋 +1 位作者 洪青阳 郑旭玲 《中文信息学报》 CSCD 北大核心 2001年第6期19-26,共8页
本文描述了一种基于实例比较 ,辅以语义模式匹配的英文选词模型的设计。首先 ,我们讨论了汉英翻译系统英文生成中选词的重要性 ,然后比较了几种可能的选词策略并提出我们的选词模型 ,接着我们较详细地描述了生成词典的结构以及选词算法... 本文描述了一种基于实例比较 ,辅以语义模式匹配的英文选词模型的设计。首先 ,我们讨论了汉英翻译系统英文生成中选词的重要性 ,然后比较了几种可能的选词策略并提出我们的选词模型 ,接着我们较详细地描述了生成词典的结构以及选词算法。文中 ,我们还简要介绍了我们所使用的语义知识资源———《知网》 展开更多
关键词 基于实例 语义模式 知网 英文选词模型 汉英翻译系统 机器翻译 英文生成 选词策略
下载PDF
汉英机器翻译中疑问句疑问信息的分析研究 被引量:1
8
作者 杨晓峰 李堂秋 洪青阳 《计算机应用研究》 CSCD 北大核心 2001年第5期7-10,共4页
汉语的疑问句的提问信息分布于句中,不像英语那样是置于句首的,因此汉语疑问句的关键提问信息(即疑问点)的分析就成为我们需研究的主要问题。首先总结了汉语疑问句疑问结构的类型,然后提出了采用上下文无关的合一规则作为分析手段的... 汉语的疑问句的提问信息分布于句中,不像英语那样是置于句首的,因此汉语疑问句的关键提问信息(即疑问点)的分析就成为我们需研究的主要问题。首先总结了汉语疑问句疑问结构的类型,然后提出了采用上下文无关的合一规则作为分析手段的总体思路,并针对疑问结构的各类型给出相应的分析规则及算法。实验证明本文提出的分析策略具有较好的处理效果。 展开更多
关键词 汉英机器翻译 疑问句 疑问信息 专家系统
下载PDF
声纹识别在开放仪器管理中的应用 被引量:2
9
作者 赖丽旻 洪青阳 《华侨大学学报(自然科学版)》 CAS 北大核心 2015年第5期517-521,共5页
在现有的仪器工作站中加入基于GMM-HMM算法的声纹识别系统,利用声纹的唯一性识别仪器用户,实现开放仪器的无人监管.应用该声纹识别系统,进行语音动态口令测试.结果表明:该系统语音动态口令的错误接受率低于1%,可有效地防范录音冒充,保... 在现有的仪器工作站中加入基于GMM-HMM算法的声纹识别系统,利用声纹的唯一性识别仪器用户,实现开放仪器的无人监管.应用该声纹识别系统,进行语音动态口令测试.结果表明:该系统语音动态口令的错误接受率低于1%,可有效地防范录音冒充,保证系统的可靠性. 展开更多
关键词 声纹识别 仪器管理 身份认证 高斯混合模型 隐马尔可夫模型
下载PDF
基于最小分类误差准则的呼吸音分类技术
10
作者 李琳 徐文皓 +3 位作者 洪青阳 童峰 吴谨准 颜卫源 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第6期901-905,共5页
从大量呼吸音样本中归纳综合出肺部病理特征的科学表示,实现自动化、定量化的呼吸音分类,是现代医疗信息化技术的重要研究内容之一.提出了一种基于最小分类误差(minimum classification error,MCE)准则的呼吸音分类方法,建立呼吸音类别... 从大量呼吸音样本中归纳综合出肺部病理特征的科学表示,实现自动化、定量化的呼吸音分类,是现代医疗信息化技术的重要研究内容之一.提出了一种基于最小分类误差(minimum classification error,MCE)准则的呼吸音分类方法,建立呼吸音类别的分类误差损失函数,采用广义概率下降法(generalized probabilistic decent,GPD)估计得到呼吸音的隐马尔科夫模型(hidden Markov model,HMM)参数,以增强不同类型呼吸音模型的区分能力.实验结果表明,与传统的最大似然(maximum likelihood,ML)法相比,基于MCE准则求解的HMM模型,具有更好的分类效果,提高了识别准确率,客观证明了基于MCE准则的呼吸音分类技术的有效性. 展开更多
关键词 呼吸音分类 隐马尔可夫模型 最小分类误差 最大似然
下载PDF
说话人识别系统中特征提取的优化方法 被引量:5
11
作者 李铮 欧阳贝贝 +3 位作者 赵淼 李琳 洪青阳 童峰 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第6期995-1003,共9页
声学特征提取是语音信号处理,如语音识别、语音唤醒、说话人识别等的核心技术之一.围绕说话人识别任务详细介绍了其主流声学特征,以及采用这些声学特征后所产生的问题和改进方法.同时,基于说话人区分向量(x-vector)说话人识别架构提出... 声学特征提取是语音信号处理,如语音识别、语音唤醒、说话人识别等的核心技术之一.围绕说话人识别任务详细介绍了其主流声学特征,以及采用这些声学特征后所产生的问题和改进方法.同时,基于说话人区分向量(x-vector)说话人识别架构提出了一种双声学特征整合的方法,以改善识别性能,并在公开的VoxCeleb1数据集上对比几种常用声学特征在x-vector框架下的说话人识别结果,进一步验证了所提出的双特征整合方法的有效性. 展开更多
关键词 说话人识别 声学特征 特征优化 双特征
下载PDF
基于端到端的多语种语音识别研究 被引量:4
12
作者 胡文轩 王秋林 +2 位作者 李松 洪青阳 李琳 《信号处理》 CSCD 北大核心 2021年第10期1816-1824,共9页
端到端语音识别模型无需发音词典进行训练,可以大幅降低开发新语种语音识别系统的负担。本文利用端到端模型的这一优势,建立了一种语种无关的端到端多语种语音识别系统。该模型使用基于字符的建模方法进行训练,同时构建多语种输出符号集... 端到端语音识别模型无需发音词典进行训练,可以大幅降低开发新语种语音识别系统的负担。本文利用端到端模型的这一优势,建立了一种语种无关的端到端多语种语音识别系统。该模型使用基于字符的建模方法进行训练,同时构建多语种输出符号集,使其包括所有目标语言中出现的字符。模型训练生成单一模型,其网络参数为所有语种共享。在OLR竞赛提供的10个语种数据集上,相较于单语种语音识别系统,本文提出的多语种语音识别系统在所有语言上的表现都更加优秀。 展开更多
关键词 端到端 语音识别 多语种 低资源 联合学习
下载PDF
端到端闽南语合成系统的设计与实现 被引量:3
13
作者 颜世江 陈越 +3 位作者 颜婉玲 许彬彬 李琳 洪青阳 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第6期988-994,共7页
为了更好地研究语音合成在闽南语上的应用,建立了闽南语数据库,并验证了Tacotron2为有效的语音合成模型.数据库方面,建立起地方特色的闽南语词库和音素体系;模型框架方面,在Tacotron和Tacotron2以及结合了两者不同模块的融合框架上进行... 为了更好地研究语音合成在闽南语上的应用,建立了闽南语数据库,并验证了Tacotron2为有效的语音合成模型.数据库方面,建立起地方特色的闽南语词库和音素体系;模型框架方面,在Tacotron和Tacotron2以及结合了两者不同模块的融合框架上进行实验对比.在厦门大学自主采集的厦门口音闽南语数据集的基础上,使用闽南语识别模型对语音数据进行解码得到对应的带有标点符号的音素序列,通过专业定制的词典建立音素标注体系,进行多组实验,比较采样率、建模方式和模型结构对合成音质以及稳定性的影响,通过梅尔谱和编码解码对齐图等评测标准,得到了三者的最佳搭配方案. 展开更多
关键词 语音合成 端到端模型 深度学习 闽南语
下载PDF
一种采用旁瓣增强的麦克风阵列抗混响算法 被引量:3
14
作者 李剑汶 章宇栋 +1 位作者 童峰 洪青阳 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第5期711-717,共7页
在音频/视频会议、人机交互、语音识别等领域,严重的混响干扰导致麦克风阵列语音处理性能急剧下降.针对现有逆滤波等抗混响方法需要获得准确的房间传输响应,而波束形成方法抗混响性能有限的问题,基于广义旁瓣抵消器(generalized sidelob... 在音频/视频会议、人机交互、语音识别等领域,严重的混响干扰导致麦克风阵列语音处理性能急剧下降.针对现有逆滤波等抗混响方法需要获得准确的房间传输响应,而波束形成方法抗混响性能有限的问题,基于广义旁瓣抵消器(generalized sidelobe canceller,GSC)结构提出一种采用旁瓣增强的麦克风阵列抗混响算法(Sidelobeenhanceing reverberation mitigation algorithm for microphone array,SERM).该算法首先进行波束形成,初步获得增强的直达语音信号,并对旁瓣获取的混响分量进行自适应迭代增强,再将旁瓣迭代增强的误差信号作为参考噪声进行自适应噪声抵消,最终输出抗混响语音.实验结果表明,在混响环境下该方法能有效改善麦克风阵列的语音信号质量. 展开更多
关键词 麦克风阵列 波束形成 广义旁瓣抵消器 抗混响处理
下载PDF
基于GMM的实时说话人识别系统 被引量:2
15
作者 胡益平 蔡骏 洪青阳 《电声技术》 2007年第6期53-55,共3页
介绍了一个基于GMM实时说话人识别系统的设计与实现,系统具有实时说话人辨认和实时说话人确认功能。在实验室条件下,对不同的高斯混合密度个数及采样率进行了测试,测试了模型的自适应性能。实验表明系统具有较好的识别准确率。
关键词 说话人识别 实时系统 高斯混合模型
下载PDF
声纹识别在司法身份鉴定中的应用 被引量:2
16
作者 陈燕 洪青阳 张彩虹 《心智与计算》 2008年第1期1-7,共7页
声纹识别是一种重要的生物认证方式,同指纹一样,声纹也是不可复制的。由于语音获取的便利性和声纹识别技术的提高,其在司法身份鉴定中日渐被重视。本文采用高斯混合模型(Gaussian Mixture Model,简称GMM)并结合统一背景模型(Universal B... 声纹识别是一种重要的生物认证方式,同指纹一样,声纹也是不可复制的。由于语音获取的便利性和声纹识别技术的提高,其在司法身份鉴定中日渐被重视。本文采用高斯混合模型(Gaussian Mixture Model,简称GMM)并结合统一背景模型(Universal Background Model,UBM)进行身份鉴定,取得了良好的效果。 展开更多
关键词 声纹识别 身份鉴定 高斯混合模型 统一背景模型
原文传递
基于GMM-UBM的说话人确认系统的研究 被引量:7
17
作者 张彩红 洪青阳 陈燕 《心智与计算》 2007年第4期420-425,共5页
高斯混合模型(Gaussian Mixture Model,GMM)已经广泛的应用于文本无关的声纹识别系统,本文详细介绍了一个把背景模型(Universal Background Model,UBM)应用到说话人建模中去的说话人确认系统。由于人的声音的生物特征多变性,说话人模型... 高斯混合模型(Gaussian Mixture Model,GMM)已经广泛的应用于文本无关的声纹识别系统,本文详细介绍了一个把背景模型(Universal Background Model,UBM)应用到说话人建模中去的说话人确认系统。由于人的声音的生物特征多变性,说话人模型还需要进行自适应技术的改进。最后,实验结果证明了采用自适应技术的GMM-UBM模型的高效性。 展开更多
关键词 说话人确认 高斯混合模型 背景模型 最大后验概率算法
原文传递
基于说话人的音频分割与聚类 被引量:5
18
作者 李稀敏 洪青阳 黄晓丹 《心智与计算》 2010年第2期139-147,共9页
说话人分割与聚类主要应用于两个方面的问题,一方面可以用于自动语音识别的说话人自适应;另一方面可用于说话人检索和富文本转录。主要包括三个过程:有效语音检测、说话人分割以及说话人聚类。本文主要就这三个方面展开叙述,全面地介绍... 说话人分割与聚类主要应用于两个方面的问题,一方面可以用于自动语音识别的说话人自适应;另一方面可用于说话人检索和富文本转录。主要包括三个过程:有效语音检测、说话人分割以及说话人聚类。本文主要就这三个方面展开叙述,全面地介绍了各类算法。 展开更多
关键词 有效语音检测 说话人分割 说话人聚类
原文传递
电话信道人名识别系统的端点检测方法
19
作者 陈晓阳 洪青阳 陈燕 《心智与计算》 2008年第2期171-175,共5页
根据孤立词和电话语音本身的特点,在传统的基于短时平均能量(E)和短时平均过零率(ZCR)方法的基础上,充分考虑静音、噪声、有效语音段等各种声音的特点,检测出待识别语音段的有效部分,再进行起止点微调最终确定起止端点。经实验验证,结... 根据孤立词和电话语音本身的特点,在传统的基于短时平均能量(E)和短时平均过零率(ZCR)方法的基础上,充分考虑静音、噪声、有效语音段等各种声音的特点,检测出待识别语音段的有效部分,再进行起止点微调最终确定起止端点。经实验验证,结果显示改进后的算法在常见的弱噪声环境下能达到较好的检测效果。 展开更多
关键词 电话人名识别系统 端点检测 能量 过零率
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部