快速HAC聚类算法的改进及应用于无监督语音分割被引量：1

Improvement of Fast HAC Clustering Algorithm and Application to Unsupervised Speech Segmentation

下载PDF

导出

摘要 HAC是一种常用的聚类方法。本文的目的是根据语音特征中的音素与连续时间的紧密关系,改进HAC快速算法提高无监督分割语音信号到类似音素单位。该算法是基于同一段特征相似度高于跨段特征的相似度。特征的相似度是通过计算相邻特征间的欧式距离,来得到输入语音特征相邻的距离双链表,链表中的每个节点由语音相邻特征的距离和指向前后相邻节点的指针组成。该算法也是通过遍历相邻距离节点链表,查找最小距离后,对相似的相邻特征进行合并,并重复迭代至最后一个类或满足某个阀值。整个过程完全基于无监督下完成,该方法优于快速HAC算法,与快速HAC算法相比能提升65倍以上的聚类速度,节约更多的内存空间,可应用于零资源的语音分割。 HAC is a commonly used clustering method. According to the close relationship between phonemes and continuous time in speech features, the purpose of this paper is to improve the HAC fast algorithm to improve the unsupervised segmentation of speech signals to similar phoneme units. The algorithm is based on the fact that the similarity of the same segment feature is higher than that of the cross-segment feature. The similarity of features is to calculate the Euclidean distance between adjacent features to obtain the adjacent distance double-linked list of input speech features. Each node in the linked list is composed of the distance of adjacent speech features and pointers pointing to the adjacent nodes before and after. The algorithm also traverses the linked list of adjacent distance nodes, finds the minimum distance, combines similar adjacent features, and iterates to the last class or satisfies a certain threshold. The whole process is completed completely without supervision. This method is better than the fast HAC algorithm. Compared with the fast HAC algorithm, it can improve the clustering speed by more than 65 times, save more memory space, and can be applied to zero-resource speech segmentation.

作者韦占江梁宇

机构地区云南大学软件学院

出处《计算机科学与应用》 2020年第8期1464-1470,共7页 Computer Science and Application

关键词无监督音素 HAC算法语音分割相邻 Unsupervised Phoneme HAC Algorithm Speech Segmentation Adjacent

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献2

1邹臣嵩,段桂芹.基于改进K-medoids的聚类质量评价指标研究[J].计算机系统应用,2019,28(6):235-242. 被引量：9
2李勃昊,张连海,郑永军.基于声学分段模型的无监督语音样例检测[J].数据采集与处理,2016,31(2):407-414. 被引量：2

二级参考文献26

1王开军,张军英,李丹,张新娜,郭涛.自适应仿射传播聚类[J].自动化学报,2007,33(12):1242-1246. 被引量：145
2Shen W, White C M, Hazen H T. A comparison of query-by-example methods for spoken term detection [C]// Interspeech 2009. Brighton, United Kingdom: Es. n.l, 2009: 2143-2146.
3Chelba C, Hazen T J, Saraclar M. Retrieval and browsing of spoken content [J]. IEEE Signal Processing Magazine, 2008, 25 (3):39-49.
4Jansen A, Dupoux E, Goldwater S. A summary of the 2012 JHU CLSP workshop on zero resource speech technologies and models of early language acquisition [C]// ICASSP 2013. Vancouver, Canada : Es. n. 1, 2013 : 8111-8115.
5Park A S, Glass J R. Unsupervised pattern discovery in speech [J]. IEEE Transactions on Audio, Speech and Language Pro- cessing, 2008, 16(1):186- 197.
6Hazen T J, Shen W, White C. Query-by-example spoken term detection using phonetic posteriorgram templates [C] // Au- tomatic Speech Recognition and Understanding 2009. Merano/ Meran, Italy: Es. n. , 2009=421-426.
7Zhang Y D, (}lass J. Unsupervised spoken keyword spotting via segmental DTW on Gaussian posteriorgrams [C] // Automatic Speech Recognition and Understanding 2009. Merano/ Meran, Italy:Is. n. 1, 2009:398-403.
8Wang H P, Lee T, Leung C. Unsupervised spoken term detection with acoustic segment model [Cl//Int Conf Speech Data base and Assessments. Hsinchu, China: Es. n. 1, 2011 : 106-111.
9Wang H P, Leung C, Lee T, et al. An acoustic segment modeling approach to query-by-example spoken term detection [C]// ICASSP2012. Kyoto, Japan:s.n.l, 2012= 5157-5160.
10Zhang Y D, Glass J. A piecewise aggregate approximation lower-bound estimate for posteriorgram based dynamic time warping[C]// Interspeech 2011. Florence, Italy:2s. n. 1, 2011: 1909- 1912.

共引文献9

1欧晓聪.基于自动纠错的最小编辑距离优化算法[J].网络安全技术与应用,2019,0(12):44-48. 被引量：3
2宋明蕊,李先国.机器学习在营销领域的应用:综述与展望[J].未来与发展,2020,44(9):78-86. 被引量：2
3刘锋,邹臣嵩,崔炜.大数据环境下基于K中心点优化算法的Web服务组合[J].计算机与现代化,2020(12):20-24. 被引量：1
4马钰,莫路锋.通过密度思想和聚类有效性指标改进的K-means算法[J].现代电子技术,2021,44(17):120-123. 被引量：9
5李斌,冯延明,刘伟,侯秀梅,陆杭.基于K-Medoids聚类算法的电网工程数据处理技术研究[J].电子设计工程,2021,29(22):119-122. 被引量：4
6张雨曦,刘姗姗.基于改进聚类算法的英文翻译误差校正系统[J].自动化技术与应用,2022,41(11):88-91. 被引量：1
7赵鑫,陈臣鹏,毕贵红,陈仕龙.基于PAM-SSD-LSTM的短期风速预测[J].太阳能学报,2023,44(1):281-288. 被引量：9
8毕贵红,赵鑫,李璐,陈仕龙,陈臣鹏.双模式分解CNN-LSTM集成的短期风速预测模型[J].太阳能学报,2023,44(3):191-197. 被引量：11
9陈思萱,刘莉莉.基于数据挖掘的中医特色治疗绩效考核指标研究[J].现代信息科技,2024,8(16):118-122.

同被引文献11

1刘丛,邬春学.进化多目标距离矩阵聚类研究[J].小型微型计算机系统,2016,37(6):1298-1302. 被引量：3
2何志明.图像分割综述[J].山东工业技术,2016(22):226-226. 被引量：4
3付丽梅.使用彩色直方图均衡法改进的Mean Shift行人跟踪算法[J].软件工程,2019,22(2):17-19. 被引量：5
4杜冠军,佟国香.一种新的混合演化多目标优化算法[J].软件,2019,40(2):6-10. 被引量：4
5刘丛,陈倩倩,陈应霞.多距离聚类有效性指标研究[J].小型微型计算机系统,2019,40(10):2209-2214. 被引量：1
6李振宇,胡涵.基于组合排序的约束多目标优化算法[J].计算机技术与发展,2019,29(11):32-36. 被引量：3
7宋昊泽,吴小俊.图像多尺度密集网络去模糊模型[J].激光与光电子学进展,2019,56(21):24-32. 被引量：3
8孙涛,李东升.基于非凸的全变分和低秩混合正则化的图像去模糊模型和算法[J].计算机学报,2020,43(4):643-652. 被引量：6
9严加展,陈华,李阳.改进的模糊C-均值聚类有效性指标[J].计算机工程与应用,2020,56(9):156-161. 被引量：12
10刘丛,万秀华,彭敦陆,邬春学.基于多目标进化算法的多距离聚类研究[J].计算机应用研究,2019,36(1):94-98. 被引量：4

引证文献1

1高华,邬春学.一种快速自动多目标图像分割算法[J].软件导刊,2020,19(11):212-216. 被引量：1

二级引证文献1

1王正,吕非,齐宇霄,童莹.基于深度学习的安全帽佩戴状态实时检测研究[J].物联网技术,2021,11(10):21-23. 被引量：3

1王志刚.一种无线mesh低功耗设计方法[J].黄河科技学院学报,2020,22(2):47-49.
2李宇翔,李帅,宋艳琼,张福泉,周湘贞.基于Spark平台的K均值聚类算法的人力资源推荐[J].济南大学学报（自然科学版）,2020,34(5):430-435. 被引量：11
3潘雅雯.汉字文化背景下,儿童参与识字教学初探[J].小学阅读指南（高年级版）,2020(11):36-37.
4蔡志远.上向水平分层采矿法回采技术改进及应用探讨[J].华东科技（综合）,2020(11):363-363.
5赵鑫,汪丽娟,行艳妮,赵燚,赵京霞,钱育蓉.改进的CK-means优化及并行策略[J].计算机应用研究,2020,37(11):3287-3291. 被引量：7
6张瑞华.基于优化水平集的细胞图像阈值分割算法[J].湖北民族大学学报（自然科学版）,2020,38(1):102-106.
7王庆伟.如何在小学语文教学中培养学生的人文素养[J].中华传奇,2019(28):0046-0046.
8段延锋.金融发展对经济增长的影响分析[J].中国管理信息化,2020,23(20):132-133.
9张晓滨,母玉雪.改进的方差优化初始中心的K-medoids算法[J].计算机技术与发展,2020,30(7):42-45. 被引量：1
10克里斯坦·德瑞格尔.全面建成小康社会的经济含义[J].中国报道,2020(10):112-112.

计算机科学与应用

2020年第8期

浏览历史

内容加载中请稍等...

快速HAC聚类算法的改进及应用于无监督语音分割被引量：1

参考文献2

二级参考文献26

共引文献9

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

快速HAC聚类算法的改进及应用于无监督语音分割 被引量：1

参考文献2

二级参考文献26

共引文献9

同被引文献11

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

快速HAC聚类算法的改进及应用于无监督语音分割被引量：1