可配置语音识别输出概率计算协处理器的设计

Design of a configurable output probability calculation coprocessor for speech recognition

导出

摘要在基于连续隐含Markov模型的嵌入式语音识别系统中,为提升计算效率、降低系统功耗,将算法中计算消耗最大的输出概率计算模块作为协处理器实现。通过先入先出队列电路隔离输出概率计算中的Markov距离和对数加法的数据通路使得系统参数可以灵活配置,并根据输出概率计算所需参数的地址产生规则设计了地址产生单元。采用Xilinx Virtex-5系列FPGA实现了该输出概率协处理器,并通过S3C44B0X微控制器验证了该设计。在配置参数为3维Gauss混合分量、27维特征矢量的条件下,对358个状态,协处理器工作在27MHz的时钟频率时计算输出概率的处理速度达到了0.13倍实时。 The most time-consuming output probability in embedded speech recognition systems based on the continuous hidden Markov model was computed using a configurable co-processor to promote the computation efficiency and lower the system power consumption. The output probability calculation （OPC） includes the Mahalanobis distance and the add-log modules with a FIFO used to separate these two circuits,therefore,making the designed system more configurable. The address generation unit was also specially designed for the OPC. The coprocessor was implemented on the Xilinx Virtex-5 and verified by using S3C44B0X as a host controller. Experiments show that the coprocessor costs 0.13 real-time to calculate 358 states＇ output probabilities with 3-D Gaussian mixtures and 27-D speech feature vectors and with clock of 27 MHz.

作者梁维谦刘国旗杨华中

机构地区清华大学电子工程系清华大学微电子学研究所

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2010年第4期636-639,共4页 Journal of Tsinghua University(Science and Technology)

基金国家“八六三”高技术研究发展计划重点项目(2008AA010700)

关键词语音识别输出概率计算并行计算 FIFO speech recognition output probability calculation parallel computing FIFO

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献5

1DONG Ming, LIU Jia, LIU Runsheng. Speech interface ASIC of SOC architecture for embedded application [C]// ICSP'02. Piscataway, NJ: IEEE Press, 2002.. 402-405.
2董明,刘加,刘润生.高性能汉语数码语音识别芯片系统[J].清华大学学报（自然科学版）,2003,43(9):1257-1260. 被引量：5
3施妙根.科学与工程计算基础[M].北京:清华大学出版社,1999,8:140-142.
4LI Peng, TANG Huang, LIANG Weiqian. Low power embedded speech recognition system based on an mcu and coprocessor [C]// ICASSP'09. Taipei, China: IEEE Press, 2009, 625-628.
5李鹏,智强,董明,梁维谦,刘润生.嵌入式语音识别Mahalanobis距离计算模块[J].清华大学学报（自然科学版）,2008,48(7):1202-1204. 被引量：2

二级参考文献6

1DONG Ming, LIU Jia, LIU Runsheng. Speech interface ASIC of SOC architecture for embedded application [C]// ICSP' 02. Piscataway, NJ : IEEE Press, 2002 : 402 - 405.
2HUANG Xuedong. Spohen Language Processing: A Guide to Theory, Algorithm, and System Development [M]. Upper Saddle River, NJ: Prentice Hall PTR, 2001.
3Hennessy J L, Patterson D A. Computer Architecture: A Quantitative Approach [M]. Third Edition. Burlington, MA, USA: Elsevier Science, 2004.
4Ciletti M D. Advanced Digital Design With the Verilog HDL [M]. Boston, MA, USA: Prentice Hall, 2005.
5顾良,刘润生.汉语数码语音识别:发展现状、难点分析与方法比较[J].电路与系统学报,1997,2(4):32-39. 被引量：12
6董明,刘加,刘润生.高性能汉语数码语音识别芯片系统[J].清华大学学报（自然科学版）,2003,43(9):1257-1260. 被引量：5

共引文献10

1胡彦超,陈章位.实验模态分析中一种改进的傅氏域离散正交多项式[J].振动工程学报,2008,21(1):43-47. 被引量：5
2李声锋,檀结庆,谢成军,李璐.基于Thiele连分式逼近的四阶迭代公式[J].中国科学技术大学学报,2008,38(2):138-140. 被引量：5
3李声锋,檀结庆,谢进,霍星.基于连分式逼近的Chebyshev迭代公式[J].合肥工业大学学报（自然科学版）,2008,31(7):1131-1133. 被引量：2
4李鹏,智强,董明,梁维谦,刘润生.嵌入式语音识别Mahalanobis距离计算模块[J].清华大学学报（自然科学版）,2008,48(7):1202-1204. 被引量：2
5智强,李鹏,董明,梁维谦,刘润生.基于硬件加速模块的嵌入式语音识别系统解决方案[J].电子技术应用,2008,34(8):31-33. 被引量：3
6耿慧,梁维谦,董明,刘润生.基于FPGA的语音识别SoC系统解决方案[J].电声技术,2009,33(10):32-34. 被引量：2
7李声锋,周之虎,江戈,张相蓉,亓洪胜,刘晓敏.基于Thiele连分式重建Newton迭代公式[J].安徽科技学院学报,2010,24(2):28-30.
8冷冰涛,梁维谦,董保帅,原道德.基于连续识别的嵌入式孤立词识别系统[J].电声技术,2011,35(11):42-45.
9杨兴明,陈海燕,王刚.基于连分式的广义高斯分布的参数估计[J].合肥工业大学学报（自然科学版）,2012,35(7):991-996. 被引量：4
10陈洁群.基于Viterbi改进算法的汉语数码语音识别系统[J].微型机与应用,2017,36(14):11-13. 被引量：4

1网络、滤波、滤波器[J].电子科技文摘,1999(11):46-48.
2魏丽丽,邓志杰,孙传庆.线性光耦合隔离放大器LIA100的应用[J].甘肃科技,2005,21(3):116-117. 被引量：1
3吕志强,陈岚.一种带有隔离技术的高频压控振荡器[J].微处理机,2013,34(6):1-4.
4张红,郝东来.一种MIMO系统准正交分集方案[J].电子测试,2014,25(5):20-21.
5宋滨.电路的隔离技术[J].科学咨询,2008,0(7):51-51. 被引量：2
6曾素琼.电子电气设备的电路隔离技术探讨[J].低压电器,2005(11):51-54. 被引量：17
7张龙翔,张峰.IPv6新时代物联网背景下运营商的发展[J].中国电信业,2013(7):57-59.
8史亚维.LTE系统中可配置FFT的地址产生电路的设计与实现[J].电子世界,2016,0(14):185-185.
9Xilinx的65nm Virtex-5系列新增三款器件[J].电子设计技术 EDN CHINA,2008(3):121-121.
10岳元,彭亮节.SDI红外图像在火炮光电跟踪系统中的应用[J].激光与红外,2016,46(8):1023-1027. 被引量：4

清华大学学报（自然科学版）

2010年第4期

浏览历史

内容加载中请稍等...

可配置语音识别输出概率计算协处理器的设计

参考文献5

二级参考文献6

共引文献10

相关作者

相关机构

相关主题

浏览历史