基于共振峰合成和韵律调整的语音验证码方法研究被引量：4

Research on formant synthesis and prosody adjustment-based speech validation codes

下载PDF

导出

摘要为了提高语音验证技术的有效性,提出了一种基于共振峰合成、修改时长和调节韵律的随机语音验证码生成方法。该方法选择音素作为语音合成单元,基于规则在合成过程中设定随机语速参数,以及调整单元之间的连接规则来实现韵律的随机调整,使得语速和韵律具有不确定性和不可预测性,从而有效降低了自动语音识别技术(ASR)对语音码的识别率,增强了语音验证码的抗攻击性。合成的语音验证码的人耳识别率达到了90%左右,ASR的识别率为28.8%,主观平均判分(MOS)为4分,语音码的可懂度和清晰度达到了满意的效果。实验结果验证了所提方法的可行性。 In order to improve the effectiveness of speech verification technology, this paper proposed a method of speech validation codes based on formant synthesis, time scale modification and prosody regulation. This method chose phonemes as speech synthesis units and set parameters for speed regulations in the synthesis process based on rules, which adjusted the con- nection rules between units to achieve a random prosody regulation. Due to the uncertainty of speed and prosody, for speech val- idation codes, this method effectively reduced recognition rate of automatic speech recognition and enhanced resistance to at- tack. The recognition rate of synthesized speech validation codes was 90% for human ear, and 28.8% for automatic speech recognition software. The mean opinion score （MOS） was 4 points. Both intelligibility and articulation of the synthesis speech were satisfied. The experimental results confirm the practicality of the proposed method.

作者汪成亮张玉维

机构地区重庆大学计算机学院

出处《计算机应用研究》 CSCD 北大核心 2011年第7期2458-2461,共4页 Application Research of Computers

基金国家自然科学基金资助项目(61004112) 中国博士后科学基金资助项目(20080430750)

关键词语音合成验证码共振峰合成韵律调整时长规整 speech synthesis CAPTCHA formant synthesis prosody adjustment time scale modification

分类号 TN912.33 [电子电信—通信与信息系统] TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献14

1Von AHN L,BLUM M,LANGFORD J. Telling humans and computers apart automatically [ J ]. Communications of the ACM, 2004,47 (2) :56-60.
2戴如意,艾丽蓉,高海昌.基于多形变特征的汉字验证码的设计及实现[J].计算机应用研究,2010,27(4):1508-1510. 被引量：7
3VIMINA E R, AREEKAL A U. Telling computers and humans apart automatically using activity recognition [ C ]//Proc of IEEE International Conference on Systems, Man, and Cybernetics. 2009 : 4906-4909.
4文晓阳,高能,夏鲁宁,荆继武.高效的验证码识别技术与验证码分类思想[J].计算机工程,2009,35(8):186-188. 被引量：26
5SHIRALI-SHAHREZA S,ABOLHASSANI H, SAMETI H,et al. Spoken CAPTCHA: a CAPTCHA system for blind user[ C ]//Proc of ISECS International Colloquium on Computing, Communication, Control, and Management. 2009:221-224.
6朱晓云,徐贵宝.利用语音技术实现互联网信息无障碍[J].电信网技术,2010(1):46-49. 被引量：3
7邵艳秋,韩纪庆,王卓然,刘挺.韵律参数和频谱包络修改相结合的情感语音合成技术研究[J].信号处理,2007,23(4):526-530. 被引量：7
8Van SANTEN J P H,SPROAT R W,OLIVE J P,et a1.语音合成[M].蔡连红,杨鸿武,昊志勇,等译.北京:机械工业出版社,2005.
9KLATY D H, KLAT'F L C. Analysis, synthesis, and perception of voice quality variations among female and male talkers [ J ]. Acoustical Society of American, 1990,87 ( 2 ) : 820-857.
10赵亮,刘文举.共振峰参数语音模型的软件实现[C]//中国自动化学会第20届青年学术会议.2005:252-257.

二级参考文献37

1薛磊,杨晓敏,吴炜,陈默,何小海.一种基于KNN与改进SVM的车牌字符识别算法[J].四川大学学报（自然科学版）,2006,43(5):1031-1036. 被引量：21
2吉治钢.基于验证码破解的HTTP攻击原理与防范[J].计算机工程,2006,32(20):170-172. 被引量：20
3全球中文论坛100强[Z/OL].(2004-10-12).http://www.qihoo.corn/forum/portal/topbbs,top100.htm.
4文晓阳,高能,荆继武.论坛验证码技术的安全性分析[C]//全国计算机安全学术交流会论文集.张家界,中国:[出版者不详],2007.
5Ming Jiang. Digital Image Processing[EB/OL]. (2006-09-26). http://iria, pku.edu.cn/-jiangm/courses/dip/html/node68.html.
6He Chunlei, Zhang Ping, Dong Jianxiong, et al. The Role of Size Normalization on the Recognition Rate of Handwritten Numerals[C]//Proc. of NNLDAR'05. [S. l.]: IEEE Press, 2005.
7MySpace Continues to Make The Captcha Tougher![EB/OL]. (2007-09-09). http:llarmyofblogs.coml2007/09/091mys ace-loosingthier-minds/.
8AHN L,BLUM M,HOPPER N,et al.CAPTCHA:using hard AI problems for security[J].Lecture Notes in Computer Sconce,2003,2656(9):294-311.
9HALL R V.CAPTCHA as a Web security control[EB/OL].(2005-12-17)(2008-10-26).http://www.richhall.com/isc4350/captcha_20051217.htm.
10YAN J,AHMAD A S E.Usability of CAPTCHAs or usability issues in CAPTCHA design[C]// Proc of the 4th Symposium on Usable Privacy and Security.New York:ACM,2008:44-52.

共引文献41

1卢竑,关英伟.北流白话单字调声学实验研究[J].声学技术,2008,27(6):867-872. 被引量：2
2韩文静,李海峰,王朝友.语音情感信息可视化建模研究与探析[J].燕山大学学报,2010,34(2):128-132.
3唐娅琴.验证码的设计与破解探讨[J].计算机与数字工程,2010,38(5):116-118. 被引量：1
4莫双燕,关海欣,郑可欣.语音时长调整快速算法[J].声学技术,2010,29(5):507-511. 被引量：1
5陈艳伟.多媒体在推进图书馆无障碍服务中的应用研究[J].图书馆建设,2011(1):71-74. 被引量：16
6贺强,晏立.基于形状上下文的复杂验证码识别算法[J].计算机工程,2011,37(2):200-202. 被引量：7
7顾翼,武妍.基于结构知识的手写体汉字合成方法[J].计算机工程,2011,37(3):266-268. 被引量：2
8胡征兵,路红,廖龙龙.基于多图层的图形验证码生成技术研究[J].计算机与现代化,2011(2):1-4. 被引量：3
9陈明义,党培霞.基于情感基音模板的情感语音合成[J].中南大学学报（自然科学版）,2010,41(6):2258-2263. 被引量：4
10殷光,陶亮.一种SVM验证码识别算法[J].计算机工程与应用,2011,47(18):188-190. 被引量：18

同被引文献32

1陈占芳,冯欣,张伟.随机中文汉字验证码的生成及应用[J].电脑知识与技术（过刊）,2007(16):1096-1097. 被引量：7
2潘玉春,徐明星,贾培发.面向情感语音识别的建模方法研究[J].计算机科学,2007,34(1):163-165. 被引量：1
3KK Wijekumar. Implementing web - based intelligent tutoring systems in K - 12 settings: a case study on approach and challen- ges[J].2006,35 (2): 193-208.
4P Brusilovsky. Adaptive and intelligent technologies for Web based education [ M ]. Bertin :Springer Berlin Heidelberg,1999: 19- 25.
5J Beck, M Stem, E Haugsjaa. Applications of AI in education[J]. 1996,3 (1) :11 -15.
6D Johnson. Computer tutors get personal[ J] .2005,33 (3) :14 - 19.
7贺雪晨,周自斌.多媒体技术实用教程(第3版)[M].北京:清华大学出版社,2013:218.
8戴如意,艾丽蓉,高海昌.基于多形变特征的汉字验证码的设计及实现[J].计算机应用研究,2010,27(4):1508-1510. 被引量：7
9贾默然,高永兵.PHP图片验证码的实现[J].包钢科技,2010,36(1):59-60. 被引量：5
10常祖政,卢晓倩.Java Web中随机汉字扭曲验证码的实现[J].电脑编程技巧与维护,2010(11):87-90. 被引量：2

引证文献4

1周自斌.基于互联网的智能英语听写系统设计[J].安徽科技学院学报,2013,27(5):60-62. 被引量：2
2蔺佳哲,王茜,谢楠.基于WEB开发技术的新型验证码的设计研究[J].石家庄学院学报,2016,18(3):38-41. 被引量：4
3何春辉.一种基于常识的图片验证码设计方法[J].盐城工学院学报（自然科学版）,2018,31(4):42-44. 被引量：1
4顾颖,许琪,毛贝思,林巧民.辅助听障人士的一种手语转情感语音工具的设计[J].电脑知识与技术,2022,18(15):72-74.

二级引证文献7

1余杨奎.PHP生成CAPTCHA的改进方法在平台建设中的应用[J].广东开放大学学报,2017,26(4):108-112. 被引量：1
2余杨奎.改进的PHP技术下的图片验证码实现方案[J].六盘水师范学院学报,2018,30(3):78-81.
3钟玲玲,刘冬雪,黄小平,吴密.基于C语言的学生信息管理系统设计与实现[J].河南科技学院学报（自然科学版）,2019,47(4):62-67. 被引量：12
4冯军军,王海沛,陈新华.基于Python3的极验验证码识别的研究[J].电脑知识与技术,2019,15(8):37-39. 被引量：2
5顾颖,许琪,毛贝思,林巧民.辅助听障人士的一种手语转情感语音工具的设计[J].电脑知识与技术,2022,18(15):72-74.
6杜佳俊,兰红.基于安卓SDK的图片验证码设计[J].计算机科学与应用,2020,10(3):583-589.
7丁乙诗,任云宏,兰全祥.基于Servlet的验证码设计与实现[J].电脑知识与技术,2018,0(7Z):25-26.

1袁军,张思民.嵌入式中文TTS系统的研究与实现[J].电脑知识与技术,2008(6):1345-1346. 被引量：4
2刘景云.使用安全连接规则为网络传输“保驾护航”[J].电脑迷,2015,0(11):49-50.
3周俊,王立强,李波,韩桃.基于改进二次谱基音检测的时长规整算法[J].无线电工程,2010,40(2):19-21.
4S1240DSN连接规则与CE地址码的关系[J].电信技术,1997(3):20-22.
5杜守富,毛启容,詹永照.自适应同步叠加语音时长规整算法[J].通信学报,2005,26(2):136-140. 被引量：4
6周自斌.基于互联网的智能英语听写系统设计[J].安徽科技学院学报,2013,27(5):60-62. 被引量：2
7胡义和.TCL2188型对讲机整机框图介绍[J].家电维修,2004(10):29-30.
8徐翔俊.基于内容的语音信息检索技术与系统[J].福建电脑,2015,31(5):86-87.
9周俊,高悦,谭薇,陈砚圃.语音时长规整技术的研究回溯[J].现代电子技术,2006,29(18):102-105. 被引量：6
10朱玉玺,胡学骏,赵慧民.基于数据驱动的语音库的分析与构建[J].电声技术,2006,30(5):50-52.

计算机应用研究

2011年第7期

浏览历史

内容加载中请稍等...

基于共振峰合成和韵律调整的语音验证码方法研究被引量：4

参考文献14

二级参考文献37

共引文献41

同被引文献32

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于共振峰合成和韵律调整的语音验证码方法研究 被引量：4

参考文献14

二级参考文献37

共引文献41

同被引文献32

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于共振峰合成和韵律调整的语音验证码方法研究被引量：4