-
题名基于幅度压缩滤波的清浊音分类及基音估计
被引量:4
- 1
-
-
作者
徐静云
赵晓群
王峤
王缔罡
-
机构
同济大学电子与信息工程学院
湖州师范学院工学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2016年第3期586-593,共8页
-
基金
国家自然科学基金(61271248)
湖州市自然科学基金(2015YZ04)~~
-
文摘
该文针对传统算法在实环境(不同噪声类型和信噪比)下容易发生清浊误判和基音估计错误问题,提出一种基于幅度压缩基音估计滤波(PEFAC)的清浊音分类及基音估计方法。首先,通过PEFAC削弱语音的低频噪声,提取出基音谐波;然后,采用基于对称平均幅度和函数的脉冲序列加权算法(SIM)确定谐波数目;最后,利用动态规划估计出基音,用基于3元素特征矢量的高斯混合模型对清浊音进行分类。仿真结果表明,在实环境下,所提方法能有效抑制清浊误判及基音估计错误现象的发生,性能优于传统方法。
-
关键词
语音信号处理
基音
幅度压缩基音估计滤波
对称平均幅度和函数
高斯混合模型
噪声语音
-
Keywords
Speech signal processing
Pitch
Pitch Estimation Filter with Amplitude Compression(PEFAC)
Symmetric average magnitude sum function
Gaussian Mixture Model(GMM)
Noise speech
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于音节时间长度高斯拟合的汉语音节切分方法
被引量:5
- 2
-
-
作者
张扬
赵晓群
王缔罡
-
机构
同济大学电子与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2016年第5期1410-1414,1420,共6页
-
文摘
研究汉语自然语音音节切分方法具有明显现实意义,比较准确的自然语音切分方法可以代替人工对一些拥有参照文本的语音进行标注。然而至今为止并没有完全准确的汉语语音音节切分方法。依据相同发音环境下汉语语音音节时间长度服从某种高斯分布和相邻语音音节之间存在短时能量波谷两个假设,提出了基于音节时间长度高斯拟合的汉语音节切分方法。对算法进行分析,根据初步切分短时能量波谷分散到各分语音段的特性,提出了简化算法,有效降低了该音节切分方法的时间复杂度。实验结果表明,音节切分准确度(与人工标注切分时间距离平方的均值)达到小数点后3位,在台式机Matlab环境下运算时间均不超过1 s,可以达到应用要求。
-
关键词
汉语
自然语音
音节切分
时间长度
波谷
高斯分布
-
Keywords
Chinese
natural speech
speech segmentation
time span
valley
Gauss distribution
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于时频二维能量特征的汉语音节切分方法
被引量:5
- 3
-
-
作者
张扬
赵晓群
王缔罡
-
机构
同济大学电子与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2016年第11期3222-3228,共7页
-
文摘
较准确的语音切分方法可以极大提高语料标注等工作的效率,有助于语音识别等应用中语音与模型的对齐。利用汉语语音在时频二维的能量特征设计了一种新的汉语语音音节切分方法。用传统方法判断静音帧,用相同时间不同频率的二维能量判断清音帧,用不同时间特定频段的0-1二维能量判断浊音帧及有话帧,综合4种判断结果给出音节切分位置。实验结果表明,该方法切分准确度优于基于归并的音节切分自动机(MBSDA)和高斯拟合法,其音节切分误差为0.029 7 s,音节切分偏差率为7.93%。
-
关键词
音节切分
时频二维
短时能量
切分偏差率
-
Keywords
speech segmentation into syllables
time-frequency-dimensional
short-time energy
segmentation deviation rate
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名无损压缩文件的参数特性分析
- 4
-
-
作者
王缔罡
赵晓群
张扬
徐静云
-
机构
同济大学电子与信息工程学院
-
出处
《燕山大学学报》
CAS
北大核心
2017年第1期74-81,共8页
-
基金
国家自然科学基金资助项目(612712486)
-
文摘
对文本文件的无损压缩文件中参数进行统计和分析,统计了无损压缩文件中匹配长度、匹配距离和压缩比等参数的概率密度函数,并分析了这些参数对二次熵编码和无损压缩文件容错译码的作用。分类并定义了受损压缩文件中的错误类型,分析了不同错误对译文的破坏程度。分析了不同类型的错误传播的统计特性以及它们对译文的影响。最后比较受损压缩文件与未受损压缩文件的特性差异,为无损压缩文件容错译码的提供指导意义。
-
关键词
无损压缩文件
受损无损压缩文件
Deflate32
LZSS
参数分析
-
Keywords
lossless compressed file
corrupted lossless compressed file
Deflate32
LZSS
parameter analysis
-
分类号
TN911.21
[电子电信—通信与信息系统]
-