期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于Java Speech API规范的语音识别引擎的实现 被引量:2
1
作者 倪素萍 董滨 +1 位作者 赵庆卫 颜永红 《微计算机应用》 2005年第2期168-172,共5页
本文介绍了Java Speech API(JSAPI)规范的语音识别引擎的系统框架,描述了采用已有的C/C++识别引擎实现JSAPI语音识别引擎的思路和实现策略,提出并分析了以事件处理和状态处理为核心来实现JSAPI规范的具体方法,完成了基于JSAPI规范的语... 本文介绍了Java Speech API(JSAPI)规范的语音识别引擎的系统框架,描述了采用已有的C/C++识别引擎实现JSAPI语音识别引擎的思路和实现策略,提出并分析了以事件处理和状态处理为核心来实现JSAPI规范的具体方法,完成了基于JSAPI规范的语音识别软件系统的实现。 展开更多
关键词 语音识别引擎 事件处理 JAVA speech api规范
下载PDF
基于JSAPI与Java3D的语音交互式场景漫游 被引量:1
2
作者 金珠 马小平 阚宏伟 《微计算机信息》 北大核心 2007年第36期178-179,共2页
本文分析了JAVA3D和JAVA语音技术接口规范(JSAPI)的结构和工作原理,描述了通过Java3D构造虚拟场景、并利用JSAPI在场景中提供语音交互,提出了语音驱动空间场景漫游模型,并以"汽车展示查询系统"为例,展示了模型的主框架设计和... 本文分析了JAVA3D和JAVA语音技术接口规范(JSAPI)的结构和工作原理,描述了通过Java3D构造虚拟场景、并利用JSAPI在场景中提供语音交互,提出了语音驱动空间场景漫游模型,并以"汽车展示查询系统"为例,展示了模型的主框架设计和实现中的关键技术。 展开更多
关键词 JSapi JAVA3D 语音识别 虚拟现实 语音交互 状态转移
下载PDF
基于Direct Play API的语音通信系统实现 被引量:1
3
作者 刘永易 于澜 《电声技术》 2006年第8期61-63,共3页
阐述了语音通信系统基于微软DirectPlayAPI开发通信软件,通过对网络结构和语音编码的详细分析和研究,成功地在多台飞行模拟器之间建立起独立的语音通信网络;为保证飞行模拟器声音仿真的完整性,语音通信计算机在完成语音数据交换的同时... 阐述了语音通信系统基于微软DirectPlayAPI开发通信软件,通过对网络结构和语音编码的详细分析和研究,成功地在多台飞行模拟器之间建立起独立的语音通信网络;为保证飞行模拟器声音仿真的完整性,语音通信计算机在完成语音数据交换的同时完成单机电台罗盘声、语音告警等声音的仿真。 展开更多
关键词 语音通信 DIRECT PLAY api 语音编码
下载PDF
语音识别技术在数字图书馆检索系统中的应用 被引量:7
4
作者 叶小榕 邵晴 《科技导报》 CAS CSCD 2008年第18期75-79,共5页
概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统... 概要介绍了语音识别技术和微软语音开发应用程序接口(Microsoft Speech API,SAPI)。语音识别技术随着计算机技术的发展而逐渐成熟,使计算机能够识别用户的语音输入,记录下用户的语音信息并执行相应的命令。微软的SAPI是Windows操作系统下的语音识别开发平台,它开发快捷,有设计良好的运行机制、识别引擎和调用接口,能够模块化组件开发。其次,利用SAPI,设计实现了应用语音识别技术的数字图书馆检索系统。此系统使用户在使用数字图书馆时检索更加方便,读者说出想查询的内容,系统即可完成整个检索过程并显示查询结果。此系统基于SAPI平台开发,采用了MySQL作为后台数据库。此检索系统分为一站式检索和智能检索。其中,一站式检索为读者提供了通用语音识别框,读者检索时无需使用鼠标和键盘,只需说出自己想要查找内容的关键词即可查询。一站式检索系统不仅能够实现对图书馆数据库的关键词检索,而且在界面上还同步提示出可选关键词、现有馆藏书目、借阅情况等信息,协助用户检索信息。而智能检索是在一站式检索的基础上,结合了中文分词技术,进一步降低搜索难度方便用户使用。用户检索时无需考虑关键词、检索语法,只需像平时一样说出想检索的内容,检索系统会自动识别用户的语音,然后进行智能分词,再通过转换过程,过滤出关键词并生成专业的检索语法进行检索,并最终返回检索结果。整个识别、分词、转换过程由系统自动完成,无需读者干预。随着技术的进步,结合了语音识别的检索系统将使数字图书馆能够更加方便快捷地为读者服务。 展开更多
关键词 数字图书馆 语音识别技术 微软语音识别api
下载PDF
基于TTS和SR技术的英语自学系统设计 被引量:8
5
作者 李广丽 张红斌 《华东交通大学学报》 2009年第2期86-90,共5页
文-语转换技术和语音识别技术是实现英语自学系统的关键技术。介绍了英语自学系统的工作原理和软件结构,并在.Net环境下导入了语音应用程序编程接口-The Microsoft Speech API,利用该接口编程实现了朗读训练、听写训练和阅读训练等功能... 文-语转换技术和语音识别技术是实现英语自学系统的关键技术。介绍了英语自学系统的工作原理和软件结构,并在.Net环境下导入了语音应用程序编程接口-The Microsoft Speech API,利用该接口编程实现了朗读训练、听写训练和阅读训练等功能。系统综合运用了声音和动画的多媒体手段,获得了良好的人机交互效果。 展开更多
关键词 英语自学系统 文-语转换 语音识别 the MICROSOFT speech api .NET
下载PDF
浅谈TTS语音引擎的应用 被引量:2
6
作者 陈路 《泰州职业技术学院学报》 2007年第1期11-13,24,共4页
介绍了TTS语音引擎技术的原理、安装与应用,并运用Borland Delphi 7.0可视化编程工具开发出了一个能够进行中、英文语音朗读的软件实例,详细说明了TTS语音引擎技术的使用方法与技巧。
关键词 TTS语音引擎 speech api 中英文朗读
下载PDF
基于FreeTTS的语音合成技术研究 被引量:1
7
作者 陈晓林 《电脑开发与应用》 2008年第4期46-47,69,共3页
Java提供了语音API技术用于支持应用程序或Web页面中的人机语音交互,其核心技术包括语音合成和语音识别。FreeTTS是Java语音合成技术的实现手段之一,以创建电话号码朗读程序为例,探讨了基于该技术的Java语音API实现方法及相关问题。
关键词 JAVA FreeTTS 语音api 语音合成
下载PDF
在程序中加入英文朗读功能
8
作者 白桂梅 《洛阳大学学报》 2003年第2期61-64,共4页
安装MS TTS Engine与MS Speech API,在Visual Basic 6.0中开发一个具有英文全文朗读功能的程序,该程序提供了一个方便用户操作的窗体界面,界面的文本框中是用户选择、输入或粘贴的要朗读的英文文档。
关键词 程序设计 英文全文朗读功能 MS-TTS-Engine MS-speechapi VISUALBASIC6.0 窗体界面
下载PDF
中小型计算机电话语音平台的设计 被引量:4
9
作者 孙勇 孙庆文 《电声技术》 2005年第2期59-62,共4页
以一个实例为背景,介绍了中小型计算机电话语音平台的功能、组成原理、软件和硬件设计,侧重阐述了数据库查询、留言信箱、自动转接和传真的实现方法,给出了系统流程,并对其中的关键技术作了详细的说明。
关键词 ACTIVEX数据对象 文字一语音转换 应用程序接口
下载PDF
基于Windows 98环境的多点双向数字语音通信 被引量:3
10
作者 张静 许刚 《计算机工程》 CAS CSCD 北大核心 2003年第6期123-125,共3页
当前数字语音通信已在许多领域得到了广泛应用。文章阐述了应用音频处理API函数 ,采用Client/Server模式和双套接字机制,在基于Windows 98系统上完成多点双向语音通信的方法,并给出其实现过程。实现机制为发送端利用低层音频服务的... 当前数字语音通信已在许多领域得到了广泛应用。文章阐述了应用音频处理API函数 ,采用Client/Server模式和双套接字机制,在基于Windows 98系统上完成多点双向语音通信的方法,并给出其实现过程。实现机制为发送端利用低层音频服务的回调机制对音频数据块进行动态循环处理,防止了由于系统在写满语音输入缓冲区后,新、旧缓冲区交换时有一定的间隙而产生的输入数据泄漏。接收端采用数据缓冲机制,避免了由于网络延时等待音频数据而产生的话音停顿。 展开更多
关键词 多点双向数字语音通信 WINDOWS98 多媒体 互联网 音频处理
下载PDF
SCADA系统实时信息语音平台的设计与开发 被引量:1
11
作者 吴涛 蔡宁 袁启昌 《微计算机信息》 北大核心 2008年第28期163-165,共3页
本文研究了SCADA系统中语音平台的设计以及实现语音平台的思路和关键技术,重点介绍了工业语音平台的结构设计以及通过OPC协议获取SCADA系统信息和使用微软的SAPI技术实现语音输出的主要步骤和编程技巧。该语音平台的成功应用使控制系统... 本文研究了SCADA系统中语音平台的设计以及实现语音平台的思路和关键技术,重点介绍了工业语音平台的结构设计以及通过OPC协议获取SCADA系统信息和使用微软的SAPI技术实现语音输出的主要步骤和编程技巧。该语音平台的成功应用使控制系统可以通过语音播报的方式把实时信息及时传递给用户,扩展了控制系统的HMI功能,可推广应用到目前大多数具有OPC Server的SCADA系统中,具有使用简便,可靠性高的特点。 展开更多
关键词 数据采集与监视控制系统 OLE for Process Control(OPC) Microsoft speech api(Sapi) Text To speech(TTS)
下载PDF
机器人无线远程控制系统的人机接口 被引量:2
12
作者 王晓亨 陆宇平 《信息技术》 2007年第1期1-3,19,共4页
在无线局域网环境中,建立了一套以移动机器人为控制对象的、模拟Internet传输特征的远程控制技术研究平台。通过可视化的人机接口界面,可以直接向远端机器人发送控制指令,并能看到反馈的状态数据;还可通过手柄控制,语音控制、命令集可... 在无线局域网环境中,建立了一套以移动机器人为控制对象的、模拟Internet传输特征的远程控制技术研究平台。通过可视化的人机接口界面,可以直接向远端机器人发送控制指令,并能看到反馈的状态数据;还可通过手柄控制,语音控制、命令集可编程接口等方式控制机器人。最后的开发实例具有操作简便、界面友好、易于扩展等特点。 展开更多
关键词 人机接口 speech api 机器人
下载PDF
基于Scopus检索和TFIDF的论文关键词自动提取方法 被引量:8
13
作者 陈列蕾 方晖 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第3期604-611,共8页
客观准确的关键词能够帮助电子数据库对科研文献进行分类,也能帮助研究人员缩小文献检索的范围.提出基于TFIDF(Term Frequency-Inverse Document Frequency)与Scopus数据库检索的方法自动提取英文科研文献的关键词,将Scopus数据库包含... 客观准确的关键词能够帮助电子数据库对科研文献进行分类,也能帮助研究人员缩小文献检索的范围.提出基于TFIDF(Term Frequency-Inverse Document Frequency)与Scopus数据库检索的方法自动提取英文科研文献的关键词,将Scopus数据库包含的所有文档作为语料库,并利用Scopus API实现库内自动检索.相对于传统的人工建立并标记语料库,该方法更方便,可用数据更丰富.该方法利用摘要冗余信息量少的特点,结合全文信息的统计特征从摘要中提取关键词;考虑并建立了摘要的结构特征词,通过统计引入了短语的位置特征并进行加权,还扩展了两类停用词库用于过滤干扰词.实验结果表明该方法具有较好的性能. 展开更多
关键词 关键词提取 TFIDF 分布特征 词性标注 科研文献 SCOPUS api
下载PDF
基于4 Kb/s DP-CELP声码器的高容量语音邮件系统设计 被引量:1
14
作者 罗亚飞 鲍长春 《电声技术》 2005年第12期60-63,共4页
针对市场上国内外语音邮件产品压缩率不高、录音方式不够灵活等问题,提出一种基于4Kb/s DP-CELP 语音编码方案以及录播实时、存储高效、录音灵活的语音邮件系统设计方案。系统在Borland的C++Builder 6.0集 成开发环境下使用Windows底... 针对市场上国内外语音邮件产品压缩率不高、录音方式不够灵活等问题,提出一种基于4Kb/s DP-CELP 语音编码方案以及录播实时、存储高效、录音灵活的语音邮件系统设计方案。系统在Borland的C++Builder 6.0集 成开发环境下使用Windows底层音频API函数开发,采用双缓冲技术保证实时录播。仿真结果表明,回放话音质量 优良,系统稳定可靠,具有潜在的实用价值。 展开更多
关键词 语音邮件 语音编码 双缓冲 实时 波形音频应用程序接口
下载PDF
语音卡在电脑语音排号显示系统中的应用
15
作者 吴问付 姜苍华 《微计算机信息》 2001年第7期49-50,共2页
本文简要介绍了北京五岳鑫科技有限公司的TW8V-ID八线主叫识别语音卡,给出了此语音卡在大连市儿童医院语音排号显示系统中的应用。
关键词 医院 电脑语音排号显示系统 语音卡 语音识别
下载PDF
基于人脸识别的语音交互系统设计 被引量:1
16
作者 佘彩东 肖培 +3 位作者 宫鹤 胡天立 孟楚 陈本 《科技创新与应用》 2019年第13期111-112,115,共3页
目前,语音交互系统大多数为一对一模式,为了解决这一问题,设计了一套基于人脸识别的语音交互系统,实现了一对一到一对多模式的转换。系统的硬件部分选用开源硬件领域中较为高阶的树莓派3代b+开发板,运行linux操作系统,图像采集装置为50... 目前,语音交互系统大多数为一对一模式,为了解决这一问题,设计了一套基于人脸识别的语音交互系统,实现了一对一到一对多模式的转换。系统的硬件部分选用开源硬件领域中较为高阶的树莓派3代b+开发板,运行linux操作系统,图像采集装置为500万像素摄像头,音频输入装置为即插即用的USB麦克风;系统软件部分的开发语言为Python这一脚本语言。 展开更多
关键词 语音交互系统 人脸识别 树莓派3代 PYTHON api
下载PDF
多语言语音识别翻译系统
17
作者 莫沛 梁伟鄯 +1 位作者 殷浩天 倪志平 《黑龙江科学》 2021年第2期34-36,共3页
设计了一种多语言语音识别翻译系统,以实际需求为出发点,使用Python为基本开发语言,文本翻译可以选择有道和百度翻译两种引擎的翻译结果作对比。语音翻译主要在主程序中调用了Speech Recognition库和百度短语音识别API进行语音识别。视... 设计了一种多语言语音识别翻译系统,以实际需求为出发点,使用Python为基本开发语言,文本翻译可以选择有道和百度翻译两种引擎的翻译结果作对比。语音翻译主要在主程序中调用了Speech Recognition库和百度短语音识别API进行语音识别。视频中文字的提取功能主要使用了ffmpeg库和百度开放API接口进行了设计。经测试,文本翻译能够实现多达27种语言的互译,语音的识别翻译能够进行中英互译,视频文字提取能够对MP4视频文件中的文字进行提取并翻译,并且软件运行稳定。 展开更多
关键词 语音识别 PYTHON 百度api
下载PDF
基于社交媒体的安全态势信息采集方法 被引量:1
18
作者 常家豪 《网络安全技术与应用》 2014年第7期5-9,共5页
本文针对社交媒体的信息安全的重要性,对已经发生的安全威胁事件及时做出反应,帮助目标用户更好的控制风险、消除安全隐患。本文以新浪微博API、网络爬虫技术、使用mmseg算法实现的jcseg分词器、JAVA正则表达式中文匹配、数据统计分析... 本文针对社交媒体的信息安全的重要性,对已经发生的安全威胁事件及时做出反应,帮助目标用户更好的控制风险、消除安全隐患。本文以新浪微博API、网络爬虫技术、使用mmseg算法实现的jcseg分词器、JAVA正则表达式中文匹配、数据统计分析软件为基础,针对新浪微博的具有企业认证的用户的数据,进行关联相关用户、抓取数据、建立分类词库,并统计分析随时间变化的分类词库的词类、词频,对下一个时段的网络安全态势做出评估。 展开更多
关键词 社交媒体 安全态势 信息采集 微博api 分词器 词频 预测 评估
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部