期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
基于帧结构的语音对抗样本重点区域扰动分析
1
作者 韩松莘 郭松辉 +2 位作者 徐开勇 杨博 于淼 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期685-700,共16页
目前针对语音识别模型的对抗攻击主要是在整条语音上添加噪声,扰动范围大且引入了高频噪声.现有研究在一定程度上缩小了扰动范围,但由于语音对抗攻击需要在每帧添加扰动实现对转录结果的控制,限制了扰动范围的进一步降低.针对此问题,从... 目前针对语音识别模型的对抗攻击主要是在整条语音上添加噪声,扰动范围大且引入了高频噪声.现有研究在一定程度上缩小了扰动范围,但由于语音对抗攻击需要在每帧添加扰动实现对转录结果的控制,限制了扰动范围的进一步降低.针对此问题,从帧结构的角度研究了语音识别系统中的特征提取流程,发现分帧和加窗处理决定了帧结构中重点区域的分布,即帧内各采样点上添加扰动的重要性受采样点所处位置的影响.首先,根据对输入特征的扰动分析结果进行区域划分;然后,为了量化这些采样点对求解对抗样本的重要性,提出了对抗样本空间度量方法和相应的评价指标,并设计了在帧内不同区间上添加扰动的交叉实验,进而确定了扰动添加的重点区域;最后,在多个模型上进行了广泛的实验,表明了在重点区域添加对抗扰动能够缩小扰动范围,为高质量语音对抗样本的生成提出新的角度. 展开更多
关键词 语音识别 对抗攻击 输入特征 扰动分析 对抗样本空间度量
下载PDF
声音语句输入的研究 被引量:7
2
作者 王晓龙 王开铸 《计算机学报》 EI CSCD 北大核心 1994年第2期96-103,共8页
本文提出了声音语句输入的思想,它可以分为二个阶段处理:语音识别和语音理解,两者的接口形式为音节候选向量.通过寻求X输方向最短路径的最少元素启发式推理,必要时进行概率推理,可以取得快速、高精度的效果,再辅以良好的人机界... 本文提出了声音语句输入的思想,它可以分为二个阶段处理:语音识别和语音理解,两者的接口形式为音节候选向量.通过寻求X输方向最短路径的最少元素启发式推理,必要时进行概率推理,可以取得快速、高精度的效果,再辅以良好的人机界面和机器学习,可以使声音语句输入达到实用的程度. 展开更多
关键词 汉字系统 声音语句输入 元音识别
下载PDF
智能语音口腔电子病历系统的探索与实践 被引量:4
3
作者 徐璐 赵从朴 +2 位作者 朱雯 孙国强 朱卫国 《中国卫生信息管理杂志》 2022年第1期121-125,共5页
目的将语音识别技术应用于口腔科电子病历系统,及时、准确记录口腔电子病历,提高临床工作效率。方法基于海量医学文本数据及医学音频数据,开发多模态智能语音口腔电子病历系统。结果实现了基于语音识别技术的口腔电子病历系统与通用电... 目的将语音识别技术应用于口腔科电子病历系统,及时、准确记录口腔电子病历,提高临床工作效率。方法基于海量医学文本数据及医学音频数据,开发多模态智能语音口腔电子病历系统。结果实现了基于语音识别技术的口腔电子病历系统与通用电子病历系统的无缝衔接,有效减轻医生工作强度,提升工作效率。结论根据口腔科诊疗中需要对患者进行操作的特点,将语音识别技术融入口腔电子病历系统中,可辅助临床诊疗工作,提高病历书写质量。 展开更多
关键词 语音识别 口腔电子病历系统 语音录入
下载PDF
统计与规则相结合的计算机音字相互转换技术 被引量:3
4
作者 王轩 王晓龙 藏晓莉 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1997年第4期1-4,共4页
本文介绍了一种利用马尔克夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术。该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处理... 本文介绍了一种利用马尔克夫统计文法和自然语言理解技术相结合的计算语言模型进行汉语音节到汉字的机器自动相互转换技术。该技术集成了统计文法和句法分析方法各自的优点,可以实用于计算机大规模真实文本的音字相互转换,并且具有处理语言深度递归现象和远距离约束关系的能力。通过对从两千万语料随机抽取的一百六十万平衡语料的测试表明,音字转换正确率为带声调94.77%,无声调89.05%,字音转换正确率为99%。此项技术已被应用到大词表非特定人孤立词语音识别系统和中文WINDOWS95、WINDOS NT的智能语句输入法上。 展开更多
关键词 音字相互转换 语言模型 语音识别 统计 规则
下载PDF
基于深度神经网络的因果形式语音增强模型 被引量:4
5
作者 袁文浩 梁春燕 夏斌 《计算机工程》 CAS CSCD 北大核心 2019年第8期255-259,共5页
传统的基于深度神经网络(DNN)的语音增强方法由于采用非因果形式的输入,在处理过程中具有固定延时,不适用于实时性要求较高的场合。针对这一问题,从网络结构角度展开研究,通过实验对不同网络结构在不同输入形式下的语音增强性能进行对比... 传统的基于深度神经网络(DNN)的语音增强方法由于采用非因果形式的输入,在处理过程中具有固定延时,不适用于实时性要求较高的场合。针对这一问题,从网络结构角度展开研究,通过实验对不同网络结构在不同输入形式下的语音增强性能进行对比,寻找适用于因果形式输入的网络结构,在此基础上,结合卷积神经网络和长短期记忆网络建立一个能充分利用先前帧信息的因果语音增强模型。实验结果表明,该模型在提高基于DNN的语音增强方法实时性的同时,保证了语音增强性能,其PESQ与STOI得分分别为2.25和0.76。 展开更多
关键词 语音增强 因果形式输入 延时 深度神经网络 卷积神经网络
下载PDF
不同语音输入法的比较研究 被引量:2
6
作者 陈阳 王国民 《口腔颌面外科杂志》 CAS 2000年第2期117-119,共3页
目的 比较不同语音输入法的异同 ,为进一步认识汉语病理性语言的音声特征提供参考。方法  11例腭咽闭合功能不全患者 ,男性 6例 ,女性 5例 ;年龄 7~ 35岁 ,平均 16 .18岁。被检敏感音为 / m/、/ pa/、/ ku/ ,分别直接和间接输入计算... 目的 比较不同语音输入法的异同 ,为进一步认识汉语病理性语言的音声特征提供参考。方法  11例腭咽闭合功能不全患者 ,男性 6例 ,女性 5例 ;年龄 7~ 35岁 ,平均 16 .18岁。被检敏感音为 / m/、/ pa/、/ ku/ ,分别直接和间接输入计算机语音工作站 ,测定音长、能量、音高和第一、二、三共振峰 ,并使用统计软件 (SPSS9.0 )对数据进行处理和分析。结果 两种语音输入法的音长、音高和第一共振峰无明显差异 (P>0 .0 5 ) ,而能量和第二、三共振峰有明显差异 (P<0 .0 1)。结论 直接语音输入法和间接语音输入法有一定的区别 。 展开更多
关键词 语音输入法 计算机语音工作站 腭咽闭合功能不全
下载PDF
语音识别技术应用于EMS人机交互初探 被引量:12
7
作者 朱全胜 刘娆 李卫东 《电力系统自动化》 EI CSCD 北大核心 2008年第13期45-48,100,共5页
通过剖析能量管理系统(EMS)人机交互界面的输入端,比较几种输入工具的特点,提出引入语音识别技术。在改进后的人机界面中,对语音、鼠标和键盘3类输入工具进行了新的输入任务分配,使其协同工作,在命令控制上形成了以语音和鼠标相互配合... 通过剖析能量管理系统(EMS)人机交互界面的输入端,比较几种输入工具的特点,提出引入语音识别技术。在改进后的人机界面中,对语音、鼠标和键盘3类输入工具进行了新的输入任务分配,使其协同工作,在命令控制上形成了以语音和鼠标相互配合为主体的输入模式。与传统的人机界面相比较,改进后的人机界面在操作效率、输入的自由度和输出端的显示能力上都有明显的优势,并通过实验验证其优越性。 展开更多
关键词 语音识别 人机界面 输入端 EMS
下载PDF
浅议英语演讲比赛培训模式对英语教学实践的启示 被引量:7
8
作者 张盼 聂寒玢 《中华女子学院学报》 2013年第2期123-128,共6页
历年来,英语演讲比赛给英语学习者们提供了舞台,参赛者的语音语调、神情体态、思辨创新等给人们留下了深刻的印象。备赛培训的过程是学生在教师的指导下,加大语言"输入"和"输出"的过程,从传统的以"教师为中心&... 历年来,英语演讲比赛给英语学习者们提供了舞台,参赛者的语音语调、神情体态、思辨创新等给人们留下了深刻的印象。备赛培训的过程是学生在教师的指导下,加大语言"输入"和"输出"的过程,从传统的以"教师为中心"的教学模式转向了"以学生为中心"的教学模式,更为注重的是语言的综合训练和学生的思辨能力。将这样的英语演讲比赛培训模式引入英语教学实践,将会进一步发现学生英语学习的弱项和英语教学的薄弱环节,从而能验证英语演讲比赛培训模式确实能有效地增强学生英语的应用能力和自主学习能力,激发他们学习英语的兴趣。 展开更多
关键词 英语演讲 英语教学 语言输入假设和输出假设
下载PDF
计算机语音录入系统中准确性问题的研究 被引量:4
9
作者 高翔 《自动化与仪器仪表》 2015年第2期103-104,共2页
计算机语音录入系统是在语音识别技术上发展起来的一种技术,其能够将输入者的语言输入到计算机中,并将相应的语音信号转换成为与之相对应的文字,由于这种输入方式与其他形式的输入方式相比更加的方便、快捷,关于这方面的研究越来越多,... 计算机语音录入系统是在语音识别技术上发展起来的一种技术,其能够将输入者的语言输入到计算机中,并将相应的语音信号转换成为与之相对应的文字,由于这种输入方式与其他形式的输入方式相比更加的方便、快捷,关于这方面的研究越来越多,但是由于各方面因素的限制,计算机语音录入系统中的准确性还有待进一步提升,本文就主要针对此予以简单分析研究。 展开更多
关键词 计算机语音录入系统 准确性
下载PDF
基于Microsoft语音识别引擎的语音识别系统的设计 被引量:4
10
作者 黄妙燕 王咸锋 《电脑开发与应用》 2010年第9期74-75,共2页
为了改变人们按键操纵计算机的传统概念和习惯,实现真正意义上的人机对话,结合实例阐述了用Microsoft Speech SDK5.1实现中文语音交互的方法,可应用于各种中文语音交互公共信息服务系统。介绍了基于Microsoft语音识别引擎的语音识别系... 为了改变人们按键操纵计算机的传统概念和习惯,实现真正意义上的人机对话,结合实例阐述了用Microsoft Speech SDK5.1实现中文语音交互的方法,可应用于各种中文语音交互公共信息服务系统。介绍了基于Microsoft语音识别引擎的语音识别系统的总体结构与设计思路,最后付诸实现。 展开更多
关键词 语音识别 语音输入 语音命令 语音朗读 TTS SR
下载PDF
语音输入在航行操纵模拟器成绩评判中的应用 被引量:1
11
作者 李启华 汤先拓 姚永辉 《广州航海高等专科学校学报》 2009年第3期9-10,16,共3页
针对模拟器在实际使用中口令记录不准的问题,提出利用W indows_XP系统提供的语音输入功能,辅助判断口令,提高口令记录的准确性,论述了功能实现的思路、方法及注意事项。
关键词 模拟训练 成绩评判 口令记录 语音输入
下载PDF
语言习得最低言语输入量及其测量 被引量:6
12
作者 单兴缘 《哈尔滨科学技术大学学报》 1994年第4期107-109,共3页
提出了语言习得最低言语输入量概念,并将言语输入量与语言习得关键期两个独立的概念结合在一起,设计了测量最低言语输入量的年令递增及输入量递减实验方法。
关键词 语言习得关键期 最低言语输入量 语音分辨能力 语言习得机制
全文增补中
概念整合理论对间接言语行为的阐述力 被引量:1
13
作者 章凤花 《金陵科技学院学报(社会科学版)》 2017年第2期89-92,共4页
概念整合是一种非常普通的认知活动。概念整合理论对间接言语行为的理解和概念构建的认知过程具有极大的阐述力。从认知角度,以概念整合理论的四个心理空间和整合子网络为理论基础,对间接言语行为的理解过程进行认知分析,模拟构建间接... 概念整合是一种非常普通的认知活动。概念整合理论对间接言语行为的理解和概念构建的认知过程具有极大的阐述力。从认知角度,以概念整合理论的四个心理空间和整合子网络为理论基础,对间接言语行为的理解过程进行认知分析,模拟构建间接言语行为的动态认知机制。 展开更多
关键词 概念整合 间接言语行为 输入空间 新创结构
下载PDF
英语学习中背诵输入的作用及实证研究 被引量:8
14
作者 洪蕊 《江西教育学院学报》 2006年第4期52-54,共3页
英语背诵在现阶段大学英语教学中已遭到严重淡化。本研究采用测试的方法,探讨背诵输入在大学生第二语言习得过程中的作用。结果发现:1)通过背诵输入,学生可以掌握更多的短语知识;2)学生在翻译过程中经常使用固定短语,使翻译流畅、准确,... 英语背诵在现阶段大学英语教学中已遭到严重淡化。本研究采用测试的方法,探讨背诵输入在大学生第二语言习得过程中的作用。结果发现:1)通过背诵输入,学生可以掌握更多的短语知识;2)学生在翻译过程中经常使用固定短语,使翻译流畅、准确,速度加快;3)背诵输入对提高学生的口语和写作能力大有裨益。以上结果对现在外语教学和学习有一定启示:除了强调语法知识,熟读和背诵输入在英语的教与学中占有举足轻重的地位。 展开更多
关键词 背诵输入 口语与写作 大学英语教学
下载PDF
儿向语存在与否的实证研究 被引量:1
15
作者 陈敏 《邵阳学院学报(社会科学版)》 2009年第1期78-81,共4页
通过对一位说普通话的母亲与其儿子的逐月对话进行个案追踪研究,以及三组成人之间的对话做对比分析,本论文证明在汉语语境中儿向语与成人之间的谈话存在较大的差异性,主要表现在词汇方面,但在句法方面并未呈现明显区别。
关键词 儿向语 儿童语言 语言输入
下载PDF
低龄儿童词义理解的制约因素 被引量:1
16
作者 魏锦虹 《绵阳师范学院学报》 2003年第1期90-92,共3页
影响低龄儿童词义理解的因素主要有认知能力、社会化交往活动、母语类型、成人言语输入等等。本文的结论是在个案调查的基础上得出的 ,相信这项工作能够给早期教育一些启发。
关键词 儿童 词义 母语 认知能力 语言 心理
下载PDF
基于微信小程序的医院移动语音录入应用探索与实践 被引量:1
17
作者 张旭 王力华 赵东阳 《中国卫生信息管理杂志》 2021年第4期526-530,572,共6页
目的为医疗机构提供一种更经济、便捷、高效的移动互联网医学专业语音录入解决方案。方法对传统的“硬件麦克风”语音录入解决方案进行改造,基于移动互联网技术开发语音录入微信小程序,利用个人手机实现移动语音录入。通过对比移动语音... 目的为医疗机构提供一种更经济、便捷、高效的移动互联网医学专业语音录入解决方案。方法对传统的“硬件麦克风”语音录入解决方案进行改造,基于移动互联网技术开发语音录入微信小程序,利用个人手机实现移动语音录入。通过对比移动语音录入和“硬件麦克风”语音录入两种解决方案的语音识别准确性,评估移动语音录入解决方案的技术效果。结果移动语音录入系统上线应用,主要功能可以满足不同岗位对于语音录入的使用需求,客户端安装3433台,常用客户占比3.06%,平均每个常用客户转写录入1.82千字,平均每工作日为2.23千字。结论移动语音录入解决方案在医院内的应用,为用户提供了全新的使用体验,能够快速、灵活地满足用户需求,为语音录入在医疗机构中的建设和应用,提供了借鉴。 展开更多
关键词 语音识别技术 语音录入 移动互联网 微信小程序 效果测试
下载PDF
论言语配置在语言教学中的重要性 被引量:1
18
作者 张剑波 《云南师范大学学报(对外汉语教学与研究版)》 2004年第3期54-59,共6页
本文主要从言语配置的基本原则及其对语言教学的启示角度出发,结合语言教学的实际加以分析,提出语言教学过程遵循言语配置基本原则的重要性,并对教师言语进行分析,归纳出教师言语的配置策略.
关键词 言语配置 语言教学 对外汉语教学 双向交际 一般均衡准则 择近准则
下载PDF
基于DELPHI和SAPI的语音录入的实现
19
作者 华云 《农业网络信息》 2006年第8期99-99,102,共2页
介绍了基于DELPHI和SAPI实现语音录入的方法。
关键词 DELPHI SAPI 语音录入 语音识别
下载PDF
基于VB和SAPI的语音录入的实现
20
作者 时秀波 《农业网络信息》 2007年第4期122-123,共2页
介绍了基于VB和SAPI实现语音录入的方法
关键词 VISUAL Basic SAPI 语音录入 话音识别
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部