并行化语音识别系统的研究与设计被引量：2

Research and design of parallel speech recognition system

下载PDF

导出

摘要如何处理海量语音数据是语音识别应用的一个重要问题,采用并行化计算取代传统的单机处理,如果并行调度控制不当,最终合并的结果在合并顺序上就会出现错误,并且数据切分不合理还会造成语义连贯性的丢失导致准确率的降低,文件片段在网络上传输的时间开销也需要考虑,针对上述问题,提出了一种基于Hadoop的语音识别系统,借助其分布式文件系统HDFS与MapReduce并行算法解决文件片段传输与并行调度控制的问题,同时引入静音检测算法合理地处理文件切分,通过实验验证了该系统的有效性。 How to handle large voice data is an important problem in speech recognition applications.It uses parallel computing to replace the traditional standalone process,if the parallel scheduling control is not good,the final result will be an error and if data segmentation is unreasonable,the data will lose semantic consistency leading to decline accuracy.Pieces of the file on the network transmission costs also need to consider.To solve above problems,it proposes a speech recognition system based on Hadoop,uses HDFS and MapReduce to solve pieces of the file transfer and control parallel scheduling and uses silence detection to handle file split.Through the experiment,it proves the effectiveness of this system.

作者王硕刘文

机构地区 IBM中国研究院

出处《计算机工程与应用》 CSCD 2012年第11期71-74,共4页 Computer Engineering and Applications

关键词语音识别并行计算 HADOOP MAPREDUCE 静音检测 speech recognition parallel computing Hadoop MapReduce silence detection

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1Apache.Hadoop[EB/OL].http://lucene.apache.org/hadoop.
2Facebook.Facebook lexicon[EB/OL].http://www.facebook.com/lexicon.
3Yahoo.Launches world’s largest Hadoop production ap-plication[EB/OL].http://tinyurl.com/2hgzv7.
4Apache.Hadoop distributed file system[EB/OL].http://ha-doop.apache.org/common/docs/r0.20.0/hdfs_design.pdf.
5Ghemawat S,Gobioff H,Leung S T.The Google file sys-tem[C]//19th ACM Symposium on Operating SystemsPrinciples,Lake George,NY,2003.
6Dean J,Ghemawat S.Simplified data processing on largeclusters[C]//6th Symposium on Operating System Designand Implementation,San Francisco,CA,2004.
7Shen J L,Hung J W,Lee L S.Robust entropy-based end-point detection for speech recognition in noisy environ-ments[C]//Proc Int Conf on Spoken Lang Processing,Sydney,1998.
8Rabiner L R.A tutorial on hidden Markov models andselected applications in speech recognition[J].Proceedingsof the IEEE,1989,77(2):257-286.

同被引文献16

1朱维彬,吕士楠.基于语义的语音合成——语音合成技术的现状及展望[J].北京理工大学学报,2007,27(5):408-412. 被引量：8
2李伟,李晓强,陈芳,王淞昕.数字音频指纹技术综述[J].小型微型计算机系统,2008,29(11):2124-2130. 被引量：14
3沈崇德,王彬夫,章伯鸣.新型客户服务平台——“医患通”平台的研究与应用[J].医疗卫生装备,2008,29(11):48-50. 被引量：6
4沈崇德,王彬夫,童思木.医院数字化客户关系管理平台的研究与应用[J].中华医院管理杂志,2008,24(12):816-818. 被引量：4
5汪鹏,李刚荣,熊志勇,吴昊.“医事通”短信平台在数字化医院中的应用[J].中国医疗设备,2009,24(1):60-62. 被引量：12
6沈崇德,王彬夫,童思木.病房数字化客户服务平台的研究与应用[J].中华医院管理杂志,2009,25(4):220-222. 被引量：7
7王敏妲.语音识别技术的研究与发展[J].微型机与应用,2009,28(23):1-2. 被引量：24
8关耀铧,申凌,吴云,赵勇.音频指纹搜索中数据预处理的改进算法[J].计算机工程与应用,2010,46(21):145-147. 被引量：1
9吕勇,吴镇扬.基于矢量泰勒级数的鲁棒语音识别[J].天津大学学报,2011,44(3):261-265. 被引量：4
10谭丽丽,韦岗.卷积混叠信号的最小互信息量盲分离算法[J].通信学报,1999,20(10):49-55. 被引量：14

引证文献2

1沈崇德,童思木.医院智能语音客户服务系统的创新研究与应用示范[J].中国医学装备,2013,10(1):71-73. 被引量：7
2崔玉斌,宿玉文,宋征.基于Map-Reduce的电视新闻场景切分方法[J].电视技术,2014,38(6):91-93. 被引量：1

二级引证文献8

1程美,王力华.医疗智能语音技术与应用综述[J].中国数字医学,2021,16(8):1-7. 被引量：7
2张丽,商洪涛,王彪,刘晓日.医院微信服务平台的设计与实现[J].中国医学装备,2015,12(10):46-48. 被引量：23
3刘文华,邵尉.数字化医院语音录入系统的设计与应用[J].中国数字医学,2017,12(10):78-80. 被引量：3
4吴继全.浅谈现代科技与新闻传播的有效融合[J].西部广播电视,2017,38(19):228-228. 被引量：1
5刘晶,罗进城,左秀然.基于语音识别的移动电子病历应用探索[J].中国数字医学,2018,13(4):23-25. 被引量：13
6丁腊春.基于远程语音体征监测机器人的居家健康管理系统研究与设计[J].中国数字医学,2018,13(10):44-45. 被引量：10
7刘薇.环境声监控和识别系统设计分析[J].电脑知识与技术,2014,10(11X):7976-7978.
8黄一敏,王淼,魏明月,梅青红,高春辉.人工智能语音随访系统在儿童日间手术中心的应用[J].中国卫生质量管理,2021,28(3):9-11. 被引量：12

1薛卫,都思丹,叶迎宪.基于小波变分辨率频谱特征的静音检测[J].计算机工程,2009,35(13):232-233. 被引量：2
2杨博.分布式网络环境中基于Hadoop的矩阵乘法算法研究[J].信息通信,2016,29(4):18-19.
3赵宏挺.浅谈基于CUDA的NLM图像去噪算法[J].吉林省教育学院学报（中旬）,2013,29(10):147-148.
4薛卫,都思丹,叶迎宪.小波变分辨率频谱特征静音检测和短时自适应混音算法[J].计算机科学,2009,36(7):211-214. 被引量：1
5张玉臣,刘璟,贾利新,吴果.影响IP电话发展的关键问题研究[J].河南科学,2005,23(2):278-281. 被引量：3
6薛卫,都思丹,叶迎宪,方承志.基于变分辨率频谱特征的向量机静音检测和实时混音技术[J].中国科学技术大学学报,2006,36(8):898-901. 被引量：3
7魏臻,张景达,陆阳.嵌入式数字录音中背景噪声抑制方法研究[J].电子测量与仪器学报,2006,20(5):56-59. 被引量：3
8陈强,杜攀,陈海强,包秀国,刘悦,程学旗.K-Canopy:一种面向话题发现的快速数据切分算法[J].山东大学学报（理学版）,2016,51(9):106-112. 被引量：2
9韩希明,李治柱.多路语音传输前软件压缩处理技术[J].计算机仿真,2005,22(3):151-152.
10郭燕慧,钟义信.统计语言模型中句子的语义连贯性判别[J].情报学报,2003,22(4):472-475.

计算机工程与应用

2012年第11期

浏览历史

内容加载中请稍等...

并行化语音识别系统的研究与设计被引量：2

参考文献8

同被引文献16

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

并行化语音识别系统的研究与设计 被引量：2

参考文献8

同被引文献16

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

并行化语音识别系统的研究与设计被引量：2