-
题名基于内容和旋律的音频片段识别与检索
被引量:1
- 1
-
-
作者
吴海霞
李艳玲
刘潞锋
-
机构
长治学院计算机系
长治市郊区广电中心
-
出处
《太原师范学院学报(自然科学版)》
2015年第2期33-39,共7页
-
基金
山西省高校科技创新项目(2013160)
长治学院校级科研课题(201223)
-
文摘
介绍了音频信号的主要特征和处理技术,给出音频检索系统的处理框架和主流产品,并列出典型检索引擎及应用行业;详细阐述了音频识别和检索的主要方法、基于旋律和内容的音频片段检索的原理和特点;最后结合实验和测试中的实际问题对音频检索进行展望.
-
关键词
信息检索
音频识别
音频片段
声纹
-
Keywords
information retrieval
audio recognition
audio-clip
voiceprint
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于隐马尔可夫链的广播新闻分割分类
被引量:7
- 2
-
-
作者
庄越挺
毛祎
吴飞
潘云鹤
-
机构
浙江大学人工智能研究所
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第9期1057-1063,共7页
-
基金
教育部博士点科研基金 ( 2 0 0 10 335 0 49)
教育部优秀年轻教师基金
高等学校骨干教师资助计划资助
-
文摘
提出了使用具有模拟随机时序数据良好能力的隐马尔可夫链来完成广播新闻分割分类的算法 .首先使用含隐藏语义状态的隐马尔可夫链把原始广播新闻粗略分割分类成开始 /结束和语音两部分 ,其次应用 3个隐马尔可夫链 ,按照最大似然概率法把语音片段预识别为主持人介绍、广告和天气预报 ,最后由语义变化速率识别出新闻现场报道 ,完成广播新闻的精细分割分类任务 .
-
关键词
隐马尔可夫链
广播新闻
音频片段特征
阈值
分割分类算法
音频信号
语音识别
多媒体
-
Keywords
broadcast news, clip features, segmentation and classification, threshold, hidden Markov model
-
分类号
TN912.34
[电子电信—通信与信息系统]
TP37
[自动化与计算机技术—计算机系统结构]
-