-
题名用户评论驱动的语音测试数据生成方法
被引量:1
- 1
-
-
作者
曹冬玉
陶传奇
郭虹静
黄志球
-
机构
南京航空航天大学计算机科学与技术学院
南京航空航天大学高安全系统的软件开发与验证技术工信部重点实验室
南京大学计算机软件新技术国家重点实验室
软件新技术与产业化协同创新中心
-
出处
《小型微型计算机系统》
CSCD
北大核心
2023年第7期1382-1390,共9页
-
基金
国家重点研发计划项目(2018YFB1003900)资助
国家自然科学基金项目(61602267,61402229)资助
+2 种基金
计算机软件新技术国家重点实验室基金项目(KFKT2018B19)资助
南京航空航天大学研究生创新基地(实验室)开放基金项目(kfjj20201603)资助
中央高校基本科研业务费专项资金项目(NS2019058)资助。
-
文摘
目前,语音识别的测试需要提供语音及其转录文本,测试语音需要涵盖各个场景下的语音输入,因此,测试语音的数量远远不够.鉴于用户评论中包含用户使用场景等可辅助测试的信息,文中提出一种用户评论驱动的语音测试数据生成方法.首先,爬取移动应用市场中语音相关应用的用户评论,对其进行清洗和预处理.其次,提取评论中的语音属性并分析语音属性在评论中的组合.最后,通过数据蜕变对语音种子进行语音属性及其组合的变换,生成语音测试数据.文中对百度、阿里云和讯飞语音识别进行实验,通过语音种子与生成测试语音的输出结果是否一致来评估识别错误率.实验结果表明,生成的测试语音可以有效检测出三款语音识别软件中的错误行为.
-
关键词
用户评论挖掘
测试数据生成
语音识别
数据蜕变测试
-
Keywords
user review mining
test data generation
speech recognition
datamorphic testing
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-