-
题名基于隐马尔可夫链的音频语义检索
被引量:10
- 1
-
-
作者
吴飞
庄越挺
张引
潘云鹤
-
机构
浙江大学
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2001年第1期104-108,共5页
-
基金
国家自然科学基金
教育部优秀年轻教师基金
高等学校骨干教师资助计划资助项目
-
文摘
作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略。为了弥补这一不足,本文介绍了一个音频语义检索原型系统,在这个系统中,音频信号被分层次处理:首先分析音频信息中的短时能量、过零率和基本频率能量比等特征,音频信息流被接层次粗分为静音、和谐音乐、对话和环境背景音四类;由于环境背景音蕴涵了大量语义,环境背景音被继续细分,井用训练好的隐马尔可夫链表示每类环境背景音以进行语义检索。实验数据表明,这样的音频查询处理方式取得了良好效果。
-
关键词
隐马尔可夫链
音频语义检索
音频信号处理
多媒体
-
Keywords
Hierarchical Segmentation, Hidden Markov Model, Audio Retrieval
-
分类号
TN912.3
[电子电信—通信与信息系统]
-