期刊文献+
共找到420篇文章
< 1 2 21 >
每页显示 20 50 100
室内环境目标感知与语音协同控制
1
作者 华瑾 张文悦 +2 位作者 季鑫龙 王丽 王贶 《西安工业大学学报》 CAS 2024年第5期669-678,共10页
针对大型疾病患者术后恢复急需创新辅助技术,改善生活质量这一问题,提出了一种室内环境目标感知与语音协同控制方法,采用视觉感知技术和机械臂轨迹控制算法识别并抓取日用品。系统采用RGB-D深度相机结合添加了Ghost轻量化模块和RFA卷积... 针对大型疾病患者术后恢复急需创新辅助技术,改善生活质量这一问题,提出了一种室内环境目标感知与语音协同控制方法,采用视觉感知技术和机械臂轨迹控制算法识别并抓取日用品。系统采用RGB-D深度相机结合添加了Ghost轻量化模块和RFA卷积模块的改进YOLOv5算法,以实现对目标物体位姿信息的精确识别;利用集成了Inception模块和SE模块的改进GGCNN网络得到抓取目标物体的位置角度;通过ROS操作系统中的Moveit进行运动学解算和运动规划。通过抓取实物实验验证了所提出的改进识别算法,识别率达到90%。此外,语音抓取目标物体成功次数超过80%,系统能够高效地完成如抓取物品和倒水等基本动作,表现出良好的性能和实用性。 展开更多
关键词 机械臂 改进YOLOv5 语音控制 轨迹规划
下载PDF
基于频谱分析仪的语音识别及控制软件系统设计 被引量:3
2
作者 赵元琪 尹永柯 +1 位作者 王洪君 房明 《现代电子技术》 北大核心 2024年第6期27-31,共5页
随着数据处理技术的进步和人工智能领域的高速发展,用户在对仪器的实际使用中持续追求更为高效便捷的操控方式,同时也相当看重使用过程的灵活性和准确性,语音数据因其实用性和高效性而被广泛使用。因此,提出一种基于频谱分析仪的语音识... 随着数据处理技术的进步和人工智能领域的高速发展,用户在对仪器的实际使用中持续追求更为高效便捷的操控方式,同时也相当看重使用过程的灵活性和准确性,语音数据因其实用性和高效性而被广泛使用。因此,提出一种基于频谱分析仪的语音识别及控制软件系统。该系统支持Ubuntu 18.04及以上版本操作系统,通过语音指令实现对频谱分析仪的控制,可以实现语音唤醒、语音录入及保存、离线语音识别并转换为文字文本、可执行代码等功能。 展开更多
关键词 语音识别 控制软件 频谱分析仪 UBUNTU 语音唤醒 语音听写
下载PDF
基于Conformer的端到端中英文管制语音识别
3
作者 孔建国 韩琪聪 +1 位作者 梁海军 李煜琨 《航空计算技术》 2024年第3期1-5,共5页
将语音识别技术应用到空中交通管理系统中可以提高飞行安全并降低管制员的工作负荷,目前已有的管制语音识别技术在中英文识别上效果较差,因此提出了一种基于Conformer-CTC/Attention的中英文管制语音识别框架。该方法使用基于改进的Conf... 将语音识别技术应用到空中交通管理系统中可以提高飞行安全并降低管制员的工作负荷,目前已有的管制语音识别技术在中英文识别上效果较差,因此提出了一种基于Conformer-CTC/Attention的中英文管制语音识别框架。该方法使用基于改进的Conformer共享编码器对输入序列进行语言分类并以参数有效的方式对音频序列的局部和全局相依性进行建模,添加了语种分类模块来判断输入语音序列的语种,还采用了CTC解码器和注意力解码器联合解码的多任务建模方法。最后在建立的民航数据集对所提出的框架进行验证,试验结果表明,Conformer-CTC/Attention(Language-Category)相对于基线模型错误率降低,识别效果达到预期。 展开更多
关键词 空中交通管制 中英文语音识别 Conformer-CTC/Attention 多任务学习 端到端
下载PDF
基于Speech SDK的语音控制应用程序的设计与实现 被引量:40
4
作者 李禹材 左友东 +1 位作者 郑秀清 王玲 《计算机应用》 CSCD 北大核心 2004年第6期114-116,共3页
分析了微软SpeechSDK5.1里语音应用程序接口(SAPI)的结构和工作原理,提出了语音控制应用程序的设计方法,并以"Z+Z智能教学平台的语音识别接口"的设计为例,展示了这类系统的主框架和关键技术。
关键词 语音识别 COM SAPI 语音控制
下载PDF
3~6岁学前儿童口腔与喉部轮替运动能力特征研究
5
作者 赵纹笙 王晓雨 +4 位作者 康晓茜 刘恒鑫 曹艳静 盖彤 Kim HaKyung 《听力学及言语疾病杂志》 CAS CSCD 北大核心 2024年第5期393-397,共5页
目的探究3~6岁学前儿童口腔与喉部轮替运动能力特征以及声带协调运动的发展规律。方法选取61例3~6岁正常学前儿童,测量其最长声时(MPT),以及口腔轮替运动(diadochokinesis ability,DDK)和喉部轮替运动(laryngeal diadochokinesis abilit... 目的探究3~6岁学前儿童口腔与喉部轮替运动能力特征以及声带协调运动的发展规律。方法选取61例3~6岁正常学前儿童,测量其最长声时(MPT),以及口腔轮替运动(diadochokinesis ability,DDK)和喉部轮替运动(laryngeal diadochokinesis ability,LDDK)两类声学参数,包括评估三音节/pataka/口腔轮替速率和单音节/a/、/ha/、//、/h/喉部轮替速率。结果3~6岁学前儿童DDK和LDDK速率随年龄增加而增长,有极显著差异(P<0.01);4~5岁时儿童LDDK速率的增长率最大;儿童MPT与DDK和LDDK存在极显著的正相关(P<0.01);所有年龄组儿童LDDK中声带内收能力均大于声带外展能力,/a/LDDK>/ha/LDDK(P<0.01)、//LDDK>/h/LDDK(P<0.05)。结论年龄、MPT以及声带内收外展状态对3~6岁学前儿童口腔与喉部轮替运动能力有显著影响;4~5岁是儿童口腔和喉部轮替运动能力发展的关键时期。 展开更多
关键词 口腔轮替运动能力 喉部轮替运动能力 语言运动控制
下载PDF
电动履带式运输机智能语音控制系统的设计
6
作者 谢晓钟 吴尚璟 孙维峰 《机电技术》 2024年第4期63-67,共5页
采用语音识别模块,识别语音命令词控制电动履带式运输机。语音识别模块通过应用配置相关工作模式、识别语音命令词和发送识别语音后对应的通信命令,MCU接收、解析识别语音后对应的通信命令帧,并根据通信命令帧控制履带式运输机前进、后... 采用语音识别模块,识别语音命令词控制电动履带式运输机。语音识别模块通过应用配置相关工作模式、识别语音命令词和发送识别语音后对应的通信命令,MCU接收、解析识别语音后对应的通信命令帧,并根据通信命令帧控制履带式运输机前进、后退、左转、右转、车斗升降以及语音播放执行命令的操作。 展开更多
关键词 电动 履带 运输机 语音识别 MCU处理器 通信命令帧 语音控制
下载PDF
基于Speech SDK的机器人语音交互系统设计 被引量:8
7
作者 陈景帅 周风余 《北京联合大学学报》 CAS 2010年第1期25-29,共5页
介绍了一种基于Microsoft Speech SDK5.1的机器人语音交互系统,利用Speech SDK5.1提供的应用程序编程接口SAPI进行语音识别,对识别结果在逻辑程序中处理,使用Inter-phonic5.0语音合成技术替代TTS技术来合成语音,实现了AHRR-I接待机器人... 介绍了一种基于Microsoft Speech SDK5.1的机器人语音交互系统,利用Speech SDK5.1提供的应用程序编程接口SAPI进行语音识别,对识别结果在逻辑程序中处理,使用Inter-phonic5.0语音合成技术替代TTS技术来合成语音,实现了AHRR-I接待机器人的语音对话和语音控制。 展开更多
关键词 接待机器人 speech SDK 语音识别 语音控制 SAPI
下载PDF
基于语音交互的四足机器人多模式控制实验设计
8
作者 陈腾 荣学文 李贻斌 《实验室研究与探索》 CAS 北大核心 2024年第10期65-69,106,共6页
针对四足机器人全向运动控制、步态与行为切换、人员跟随、自主导航等多模式运动中的人机交互难题,设计了1套基于语音识别与指令解析的四足机器人交互控制系统。明确了四足机器人语音交互系统的硬件组成,并搭建了包含语音采集、识别、... 针对四足机器人全向运动控制、步态与行为切换、人员跟随、自主导航等多模式运动中的人机交互难题,设计了1套基于语音识别与指令解析的四足机器人交互控制系统。明确了四足机器人语音交互系统的硬件组成,并搭建了包含语音采集、识别、解析、播报一体的交互模块;基于SOFM网络设计了语音识别算法;基于ROS建立了语音模块与机器人运动控制模块的通信交互机制,实现了语音指令下达与机器人状态信息播报反馈。通过一系列四足机器人语音交互控制实验,验证了在动态场景下机器人的语音识别准确率高于85%,而在静态场景下则超过95%,保障了四足机器人不同运动模式的准确运动控制。 展开更多
关键词 四足机器人 语音交互 神经网络 运动控制
下载PDF
基于时序对齐的风格控制语音合成算法
9
作者 郭傲 许柏炎 +1 位作者 蔡瑞初 郝志峰 《广东工业大学学报》 CAS 2024年第2期84-92,共9页
语音合成风格控制的目标是将自然语言转化为对应富有表现力的音频输出。基于Transformer的风格控制语音合成算法能在保持质量的情况下提高了合成速度,但仍存在不足:第一,在风格参考音频和文本长度差异大的情况下,存在合成音频部分风格... 语音合成风格控制的目标是将自然语言转化为对应富有表现力的音频输出。基于Transformer的风格控制语音合成算法能在保持质量的情况下提高了合成速度,但仍存在不足:第一,在风格参考音频和文本长度差异大的情况下,存在合成音频部分风格缺失的问题;第二,基于普通注意力的解码过程容易出现复读、漏读以及跳读的问题。针对以上问题,提出了一种基于时间对齐的风格控制语音合成算法(Temporal Alignment Text-to-Speech,TATTS)分别在编码和解码过程中有效利用时序信息。在编码过程中,TATTS提出了时序对齐的交叉注意力模块联合训练风格音频与文本表示,解决了不等长音频文本的对齐问题;在解码过程中,TATTS考虑了音频时序单调性,在Transformer解码器中引入了逐步单调的多头注意力机制,解决了合成音频中出现的错读问题。与基准模型相比,TATTS在LJSpeech和VCTK数据集上音频结果自然度分别提升了3.8%和4.8%,在VCTK数据集上风格相似度提升了10%,验证了该语音合成算法的有效性,并且体现出风格控制与迁移能力。 展开更多
关键词 语音合成 时序对齐 风格控制 TRANSFORMER 风格迁移
下载PDF
基于智能语音的翻译机器人自动化控制系统设计 被引量:2
10
作者 杨维 秦波涛 《计算机测量与控制》 2024年第5期102-108,共7页
为提升自动控制效果,加快翻译速率,设计基于智能语音的翻译机器人自动化控制系统;采集外界智能语音信号,利用A/D转换器得到数字信号,启动语音唤醒模块激活翻译机器人,听写模式识别复杂语音信号,命令模式识别简单语音信号,得到语言文本... 为提升自动控制效果,加快翻译速率,设计基于智能语音的翻译机器人自动化控制系统;采集外界智能语音信号,利用A/D转换器得到数字信号,启动语音唤醒模块激活翻译机器人,听写模式识别复杂语音信号,命令模式识别简单语音信号,得到语言文本识别结果,通过深度学习关键词检测方法提取关键词作为翻译机器人的自动化控制指令,通过单片机识别自动化控制指令;实验结果表明,该系统可有效采集外界智能语音信号,在0.6 s至2 s之间时,该外界智能语音信号的振幅较小;系统运行时间最短为5.6 s,响应速度在11 m/s左右,控制误差最小为5.1%,BLEU值最高达到了42.75,控制准确率达到95.7%,提取智能语音信号的关键词,完成翻译机器人自动化控制。 展开更多
关键词 智能语音 翻译机器人 自动化控制 语音识别 最小分类错误 深度学习
下载PDF
基于多媒体语音控制的旋耕机运动控制系统研究
11
作者 王婷婷 《农机化研究》 北大核心 2024年第11期121-125,共5页
随着人工智能和多媒体技术的发展,旋耕机在农业生产中发挥着重要作用。为此,以旋耕机运动控制系统为核心,介绍了旋耕机的整体结构和控制原理,基于MFCC特征提取和VQ矢量方法设计了一种多媒体语音识别系统,实现对旋耕机耕深和运动的控制... 随着人工智能和多媒体技术的发展,旋耕机在农业生产中发挥着重要作用。为此,以旋耕机运动控制系统为核心,介绍了旋耕机的整体结构和控制原理,基于MFCC特征提取和VQ矢量方法设计了一种多媒体语音识别系统,实现对旋耕机耕深和运动的控制。基于该系统进行了相关的实验研究,证明了系统能够正常工作,语音控制平均识别率在94%以上,满足对旋耕机的语音控制要求。 展开更多
关键词 旋耕机 运动控制 多媒体 语音识别 MFCC VQ
下载PDF
智能电梯语音识别控制系统设计
12
作者 王金硕 张紫阳 +1 位作者 郑昌威 宋蕾 《智能计算机与应用》 2024年第3期199-202,共4页
随着语音识别技术的不断发展,无接触语音控制模式在公共设施上的应用也不断普及。为实现无接触语音控制模式在电梯控制系统上的应用,本文设计智能电梯语音识别控制系统,通过语音识别模块配合单片机实现对电梯的基本控制,并添加部分辅助... 随着语音识别技术的不断发展,无接触语音控制模式在公共设施上的应用也不断普及。为实现无接触语音控制模式在电梯控制系统上的应用,本文设计智能电梯语音识别控制系统,通过语音识别模块配合单片机实现对电梯的基本控制,并添加部分辅助功能以实现电梯的智能化设计,提高对于多种电梯应用环境的功能性、简化结构、拓展应用范围、实现电梯的自动化、智能化发展。 展开更多
关键词 电梯 语音识别 无接触语音控制 单片机
下载PDF
基于语音识别的智能问答机器人语音交互控制方法
13
作者 郭敬东 吴飞 +2 位作者 何德明 卢伟龙 潘建宏 《微型电脑应用》 2024年第9期65-68,76,共5页
为了提升智能问答机器人的语音交互性能,提出一种基于语音识别的智能问答机器人语音交互控制方法。利用用户对智能问答机器人下达语音命令信号的Teager能量,提取语音命令信号的语音特征,基于提取的语音命令信号语音特征,采用隐马尔科夫... 为了提升智能问答机器人的语音交互性能,提出一种基于语音识别的智能问答机器人语音交互控制方法。利用用户对智能问答机器人下达语音命令信号的Teager能量,提取语音命令信号的语音特征,基于提取的语音命令信号语音特征,采用隐马尔科夫模型构建智能问答机器人的声学模型,利用该声学模型识别智能问答机器人接收的语音命令。将语音命令识别结果作为最小二乘支持向量机的输入,将智能问答机器人的应答结果作为最小二乘支持向量机的输出,完成智能问答机器人的语音交互控制。实验结果表明,该方法识别语音命令的音素错误率、词错误率低于0.7%,能够获取良好的智能问答机器人语音交互结果。 展开更多
关键词 语音识别 智能问答机器人 语音交互 控制方法 隐马尔科夫模型
下载PDF
语音交互技术在仿真雷达伺服控制系统研制中的应用研究
14
作者 赵嘉毅 《电声技术》 2024年第9期82-84,共3页
在介绍语音交互技术的基础上,设计基于语音交互技术的仿真雷达伺服控制系统,并分析详细的设计流程。实验结果表明,该系统在语音识别、指令解析、实时响应及伺服控制等方面均取得优异的表现,验证了语音交互技术在提升雷达控制系统性能方... 在介绍语音交互技术的基础上,设计基于语音交互技术的仿真雷达伺服控制系统,并分析详细的设计流程。实验结果表明,该系统在语音识别、指令解析、实时响应及伺服控制等方面均取得优异的表现,验证了语音交互技术在提升雷达控制系统性能方面的显著效果。 展开更多
关键词 语音交互 仿真雷达 伺服控制
下载PDF
少样本情感可控语音合成研究与应用
15
作者 张梦姣 杨捍 马军 《通信技术》 2024年第9期897-904,共8页
在深度合成技术快速发展的背景下,基于现有语音合成技术,特定人物的语音合成需要在专业的录音棚收集大量的数据,同时,合成语音情感仅限于录制的数据。在VITS2方法的基础上提出了新的情感可控语音合成模型,新增了预训练的说话人特征提取... 在深度合成技术快速发展的背景下,基于现有语音合成技术,特定人物的语音合成需要在专业的录音棚收集大量的数据,同时,合成语音情感仅限于录制的数据。在VITS2方法的基础上提出了新的情感可控语音合成模型,新增了预训练的说话人特征提取模块、情感特征提取模块、双向流网络损失计算模块和混合训练技巧,实现了少样本情况下情感可控语音合成。在AISHELL3数据集进行实验,结果表明,所提模型在少样本情况下具有更高的合成自然度和合成相似度。在EDS数据集上进行实验表明,所提模型在少样本情况下具有更高的情感相似度,相比于基线方法,在客观指标上合成字错误率也更低,进一步验证了所提方法的有效性。 展开更多
关键词 语音合成 少样本 情感可控 双向流网络 情感特征提取
下载PDF
Speech SDK在语音机器人开发中的应用 被引量:6
16
作者 初琦 《北京工业职业技术学院学报》 2008年第4期32-36,共5页
首先表述了语音识别在机器人控制系统中的作用,然后重点介绍如何开发Source Access Point Iden-tifier语音识别软件系统,并实现对机器人的语音命令控制和简单的人机对话,对设计具有语音识别功能的智能机器人具有参考意义。
关键词 语音机器人 语音识别 SAPI 机器人控制系统 SDK
下载PDF
基于Speech SDK的语音识别技术在三维仿真中的应用 被引量:4
17
作者 林鸣霄 《计算机技术与发展》 2011年第11期160-162,166,共4页
随着三维仿真技术的不断发展,简单的人机交互方式已经不能满足人们对仿真环境真实感和沉浸感的要求。针对于此,提出了将基于Speech SDK5.1的语音识别技术应用到三维仿真平台的构想,分析了Speech SDK5.1的工作原理,着重研究了其语音识别... 随着三维仿真技术的不断发展,简单的人机交互方式已经不能满足人们对仿真环境真实感和沉浸感的要求。针对于此,提出了将基于Speech SDK5.1的语音识别技术应用到三维仿真平台的构想,分析了Speech SDK5.1的工作原理,着重研究了其语音识别接口,对将语音识别应用到三维仿真程序中的可能性和关键技术进行了研究。提出了一种实现动态词汇识别的方法,并通过一个简单的实例展示了实现这类技术的框架和方法,对设计有语音识别功能的三维仿真程序有一定的参考价值。 展开更多
关键词 语音识别 三维仿真 speech SDK COM 语音控制
下载PDF
语音技术在防汛“四预”平台中的应用研究
18
作者 邱文健 田茂春 +2 位作者 杨跃 范光伟 黄鹭 《人民珠江》 2024年第4期11-17,共7页
针对当前水利工程防汛“四预”系统交互方式繁琐、严重依赖实际操作人员经验、智能化应用不足等问题,开展了语音技术在防汛“四预”平台中的应用研究工作。首先,集成智能语音识别的开放式服务系统,通过标准化服务接口实时交互音频数据... 针对当前水利工程防汛“四预”系统交互方式繁琐、严重依赖实际操作人员经验、智能化应用不足等问题,开展了语音技术在防汛“四预”平台中的应用研究工作。首先,集成智能语音识别的开放式服务系统,通过标准化服务接口实时交互音频数据和识别结果;然后,梳理水利工程防汛“四预”中的业务流程,总结凝练3类实际应用场景;最后,以服务实际应用场景为目标,整理并汇集相关的水利专业词汇和句式,搭建语音数据语料库和场景技能库。在大藤峡防汛“四预”平台中的应用表明,该研究提供了更全面的信息获取渠道,有效提高了系统的智能交互能力及使用人员的工作效率,为水利工程管理工作提供了技术服务支撑。 展开更多
关键词 语音识别 智慧水利 防汛“四预”
下载PDF
基于深度学习的管制员语音质量评估
19
作者 赖鹏 杨倩 《科学技术创新》 2024年第14期1-4,共4页
在航空领域,管制员通过语音通讯获取信息,但是语音信号在经过语音设备的传输后通常会受到干扰或者损伤,该损伤影响着通信的质量。在管制员与飞行员通讯过程中语音质量的优劣直接影响着航空器运行的安全性,为保证通讯过程中语音信号的质... 在航空领域,管制员通过语音通讯获取信息,但是语音信号在经过语音设备的传输后通常会受到干扰或者损伤,该损伤影响着通信的质量。在管制员与飞行员通讯过程中语音质量的优劣直接影响着航空器运行的安全性,为保证通讯过程中语音信号的质量,因此考虑对语音信号进行实时评估。然而主观的评估方法成本高,且主观因素较大,因此考虑通过选取客观语音质量评估方法。基于深度学习的语音质量评估属于无参考的语音质量评估,适应于对通过传输并被记录下的管制语音进行客观评估。 展开更多
关键词 语音质量评价 深度学习 神经网络 空管语音
下载PDF
基于Speech SDK的船舶机械损伤案例查询软件开发
20
作者 刘江 汪士丰 徐善林 《机电设备》 2011年第3期42-44,共3页
在分析Microsoft Speech SDK中英文引擎的基础上,在Visual Basic中实现了船舶机损案例的查询,并通过语音读出.
关键词 speech SDK 语音控制 船舶机损
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部