-
题名运用神经网络对音频数据索引的最优基的选择
被引量:2
- 1
-
-
作者
李应
侯义斌
-
机构
西安交通大学电脑与信息技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2003年第6期759-764,共6页
-
文摘
在详细探讨了反向传播训练算法之后 ,提出了用神经网络选择音频数据索引最优基的方法 .该方法用小波变换抽取音频信号的关键系数 ,根据四层小波包二分树确定输出神经元的数量与含义 ,用Levenberg Marquardt修正反向传播算法构造与训练了一个 3 2 8 8人工神经网络 .试验表明 。
-
关键词
多媒体数据库
音频数据索引
最优基
神经网络
反向传播算法
-
Keywords
audio data index
wavelet packet transform
best base
backpropagation algorithm
-
分类号
TP311.134
[自动化与计算机技术—计算机软件与理论]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名产生音频数据索引的有效方法
- 2
-
-
作者
李应
侯义斌
-
机构
西安交通大学电脑与信息技术研究所
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2002年第11期1613-1616,共4页
-
基金
福建省 2 1 1工程计算机与信息工程重点学科项目
-
文摘
支持基于例子检索的音频多媒体数据库 ,应当能够自动分析音频数据而产生音频数据的索引。本文把基于离散小波变换和基于时频分析的索引方示相结合 ,提出一种利用小波变换、小波子带的过零率、小波子带幅度的均值、一定比例的小波子带的高频系数和全部近似系数等来组成索引向量的方法 .提出的方法采用双重索引搜索 ,即在用过零率向量和平均幅度向量作为索引进行预先扫索的基础上 ,再用小波变换的关键系数向量作为索引进行详细扫索 ,实验表明 ,这种方法具有较高的检索精度和搜索效率 。
-
关键词
音频数据索引
小波变换
时频分析
关键系数
过零率
平均幅度
多媒体数据库
-
Keywords
wavelet transform
time frequency analysis
key coefficient
zero cross rate
average magnitude
-
分类号
TN912
[电子电信—通信与信息系统]
-
-
题名基于内容的音频检索关键技术研究
被引量:7
- 3
-
-
作者
朱爱红
李连
-
机构
海军航空工程学院
-
出处
《现代计算机》
2003年第11期37-40,51,共5页
-
文摘
音频是一种重要的媒体,包含丰富的听觉特征。本文根据当前音频检索研究的进展,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。
-
关键词
音频检索
音频索引
音频信号
音频特征提取
语音信号处理
语音识别
-
Keywords
Content-based Audio Retrieval
Speech Recognition
Audio Classification
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于内容的音频检索算法研究
被引量:7
- 4
-
-
作者
刘维华
崔涛
-
机构
华北计算技术研究所
-
出处
《计算机工程与设计》
CSCD
北大核心
2006年第16期3003-3006,共4页
-
文摘
随着音频检索需求的提高,传统数据库越来越不能满足音频检索的需求,基于内容的音频检索的研究变得越来越重要。因此对音频特征的直方图表示及音频索引二叉树进行了调查,在此基础上详细描述了基于音频索引二叉树的检索算法(包括统一格式算法、非统一格式算法、部分匹配算法、虚拟节点算法),分析这些算法的时间复杂度,为下一步研究做准备。
-
关键词
音频特征直方图
音频索引二叉树
统一格式算法
非统一格式算法
部分匹配算法
虚拟节点算法
-
Keywords
histogram-based feature
binary treeofhistogram-basedfeature
SBRF
SBUF
PM
VN
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名多媒体融合分析和检索技术研究
- 5
-
-
作者
李连
朱爱红
-
机构
海军航空工程学院
-
出处
《图书馆杂志》
CSSCI
北大核心
2004年第1期30-32,67,共4页
-
文摘
多媒体是文本、图像、视频、音频等多模态信息的综合体,每一模态都表示了丰富的语义信息,只有多模态的融合才能表示多媒体的完整语义信息。为了提高多媒体信息检索的性能,应结合多种信息检索技术、本文介绍了目前多媒体融合分析与检索方法,论述了其关键技术。
-
关键词
多媒体信息
检索技术
多媒体融合分析
音频索引
图像索引
视频索引
-
Keywords
Cross mode
Information retrievalvSyncretic information analysis
-
分类号
G354
[文化科学—情报学]
-
-
题名人工智能时代广播电台融媒体语音智能检索技术
被引量:1
- 6
-
-
作者
刘新
-
机构
吉林广播电视台广播技术办公室
-
出处
《科技传播》
2019年第14期136-137,共2页
-
文摘
文章依托吉林人民广播电台融媒体语音智能检索技术系统进行阐述语音智能检索技术的主要内容以及语音识别、音频自动索引、关键音检索3个技术特点,语音检索的系统结构设计和逻辑构架及主要功能,融媒体语音智能检索技术系统项目实现广播电台桌面级音频搜索服务实践应用。
-
关键词
语音识别
音频自动索引
关键音索引
云计算模式
-
分类号
G2
[文化科学]
-