手势交互作为一种自然便捷的交互方式,在智能家居和智能交通等领域具有日益广泛的应用前景。由于手势行为发生的速度、空间约束和用户差异的影响,同一语义手势表现出具有不同时间和空间尺度的多形态特征,这给保障手势识别的准确率带来...手势交互作为一种自然便捷的交互方式,在智能家居和智能交通等领域具有日益广泛的应用前景。由于手势行为发生的速度、空间约束和用户差异的影响,同一语义手势表现出具有不同时间和空间尺度的多形态特征,这给保障手势识别的准确率带来了挑战。提出了一种基于动态时间规整DTW(Dynamic Time Warping)方法的时空多尺度手势识别方法 SDTW(Spatial-Temporal Dynamic Time Warping),该方法通过对空间形态数据进行分箱操作来达到适应一定程度空间尺度变化的能力。因此,SDTW方法不仅具备DTW方法的时间尺度适应性,而且扩展了空间尺度适应性。文中实现了一个基于智能手机加速度传感设备的SDTW手势识别原型系统。实验测试验证了所提方法能够有效提升手势识别的准确率。展开更多
语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral co...语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征在衡量两个语音片段声学相似度上不够鲁棒,特别是针对多说话人语料,语音模式发现的效果大打折扣。该文尝试了基于音素后验概率(posteriorgram)的特征表示方法。实验表明:在多说话人和单说话人的语料上,音素后验特征均可以得到比MFCC更好的效果。该文尝试了用词边界确定分段进行语音模式发现,这种设置可以看作基于SDTW进行模式发现的效果上限。实验表明:在预知词边界的情况下,效率和正确率都得到了明显提升。展开更多
文摘手势交互作为一种自然便捷的交互方式,在智能家居和智能交通等领域具有日益广泛的应用前景。由于手势行为发生的速度、空间约束和用户差异的影响,同一语义手势表现出具有不同时间和空间尺度的多形态特征,这给保障手势识别的准确率带来了挑战。提出了一种基于动态时间规整DTW(Dynamic Time Warping)方法的时空多尺度手势识别方法 SDTW(Spatial-Temporal Dynamic Time Warping),该方法通过对空间形态数据进行分箱操作来达到适应一定程度空间尺度变化的能力。因此,SDTW方法不仅具备DTW方法的时间尺度适应性,而且扩展了空间尺度适应性。文中实现了一个基于智能手机加速度传感设备的SDTW手势识别原型系统。实验测试验证了所提方法能够有效提升手势识别的准确率。
文摘语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征在衡量两个语音片段声学相似度上不够鲁棒,特别是针对多说话人语料,语音模式发现的效果大打折扣。该文尝试了基于音素后验概率(posteriorgram)的特征表示方法。实验表明:在多说话人和单说话人的语料上,音素后验特征均可以得到比MFCC更好的效果。该文尝试了用词边界确定分段进行语音模式发现,这种设置可以看作基于SDTW进行模式发现的效果上限。实验表明:在预知词边界的情况下,效率和正确率都得到了明显提升。