期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
在线无监督说话人检索中稳健的模型自举算法
被引量:
3
1
作者
付中华
张艳宁
《软件学报》
EI
CSCD
北大核心
2007年第3期608-616,共9页
基于回归树模型的多特征空间建模方法在回归类内部进行特征音分析,较好地解决了训练数据不足时说话人模型的训练问题,而短语音段聚类策略又进一步避免了过短的语音片断对自举训练的影响.验证实验采用了实际录制的近8小时的不同谈话数据...
基于回归树模型的多特征空间建模方法在回归类内部进行特征音分析,较好地解决了训练数据不足时说话人模型的训练问题,而短语音段聚类策略又进一步避免了过短的语音片断对自举训练的影响.验证实验采用了实际录制的近8小时的不同谈话数据.结果显示,即使平均自举片断长度小于5秒,新方法依然非常稳健,不仅提高了说话人改变检测的效果,而且优于通常的自举方法.
展开更多
关键词
说话人检索
说话人模型
回归类
特征音
下载PDF
职称材料
一种三层判决的说话人索引算法
被引量:
1
2
作者
陈雪芳
杨继臣
《计算机工程》
CAS
CSCD
2012年第2期184-185,共2页
为提高说话人索引准确率,提出一种三层判决的说话人索引算法。第1层使用惩罚距离公式对说话人改变进行检测,第2层采用说话人模型自举法进行初次说话人辨认,第3层采用GMM说话人超级矢量进行判决,解决说话人模型自举法中产生的数据不匹配...
为提高说话人索引准确率,提出一种三层判决的说话人索引算法。第1层使用惩罚距离公式对说话人改变进行检测,第2层采用说话人模型自举法进行初次说话人辨认,第3层采用GMM说话人超级矢量进行判决,解决说话人模型自举法中产生的数据不匹配问题。实验结果表明,采用惩罚距离公式,与贝叶斯信息判决方法相比不需调整参数,与DISTBIC方法相比F1值提高2%,使用GMM说话人超级矢量,在说话人索引准确率和数量准确率方面分别提高8.95%、18.25%。
展开更多
关键词
三层判决
说话人索引
惩罚距离
模型自举法
GMM说话人超级矢量
下载PDF
职称材料
一种基于性别的说话人索引算法
3
作者
杨继臣
何俊
李艳雄
《计算机工程与科学》
CSCD
北大核心
2012年第6期79-82,共4页
为了提高说话人索引准确率,对说话人改变判决中常用的贝叶斯信息判决(BIC)进行改进和在说话人辨认中使用性别信息,提出了一种基于性别的说话人索引算法。首先使用惩罚距离公式对说话人改变进行检测,解决了在说话人改变判决中使用BIC需...
为了提高说话人索引准确率,对说话人改变判决中常用的贝叶斯信息判决(BIC)进行改进和在说话人辨认中使用性别信息,提出了一种基于性别的说话人索引算法。首先使用惩罚距离公式对说话人改变进行检测,解决了在说话人改变判决中使用BIC需要不断调节惩罚因子的问题;其次在说话人改变检测的基础上,采用性别模型判断每个说话人的性别;最后把男性和女性说话人分别对待,使用说话人模型自举法对说话人进行辨认。实验结果表明:在说话人改变检测中,采用惩罚距离公式,和BIC相比不需要调整参数,和DISTBIC相比,在F1方面提高了2%;在说话人辨认方面,利用性别信息,说话人索引准确率(SIA)提高了20.93%,说话人数量准确率(SNA)方面提高了3%。
展开更多
关键词
说话人索引
性别信息
说话人模型自举法
下载PDF
职称材料
远程教学数字图书馆中基于MPEG-7的语音数据的组织索引
被引量:
1
4
作者
卢坚
杨文清
+1 位作者
陈毅松
张福炎
《情报学报》
CSSCI
北大核心
2002年第4期407-412,共6页
本文提出基于MPEG 7的教学语音内容的描述模式 ,它是语音数据的层次结构化组织和多维索引的重要依据。描述模式为用户提供了层次结构的浏览视图和导航机制 ,以及反映用户多角度观察和分析的多维索引 ,从而实现互操作性的基于内容的语音...
本文提出基于MPEG 7的教学语音内容的描述模式 ,它是语音数据的层次结构化组织和多维索引的重要依据。描述模式为用户提供了层次结构的浏览视图和导航机制 ,以及反映用户多角度观察和分析的多维索引 ,从而实现互操作性的基于内容的语音检索等服务。最后本文概要地分析了特征的自动提取和描述的自动生成技术。
展开更多
关键词
远程教学
数字图书馆
MPEG-7
描述模式
层次式组织
多维索引
跨模态信息检索
教学语音数据
下载PDF
职称材料
基于数字水印的人脸与声纹融合识别算法
被引量:
6
5
作者
王骕
胡浩基
+1 位作者
于慧敏
DAMPER R I
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2015年第1期6-14,共9页
提出远程多模态的生物特征数字水印算法,将声音特征作为水印加入到人脸图像中.运用文献[1]提出的改进型量化索引调制(QIM)方法,算法加入一个脆弱型的水印用于篡改检测,同时加入一个鲁棒型水印用于隐藏声音的高斯混合模型(GMM)参数.利用...
提出远程多模态的生物特征数字水印算法,将声音特征作为水印加入到人脸图像中.运用文献[1]提出的改进型量化索引调制(QIM)方法,算法加入一个脆弱型的水印用于篡改检测,同时加入一个鲁棒型水印用于隐藏声音的高斯混合模型(GMM)参数.利用人脸、声纹和多模态识别算法,提出的方法能够实现对篡改的检测,对常见的攻击,例如图片缩放、高斯噪声、模糊化、伽马校正和JPEG压缩等具有鲁棒性.在由295人组成的XM2VTS数据库上,该多模态系统能够获得95.93%的识别率,同时获得3.19%的等错误率.
展开更多
关键词
人脸识别
声纹识别
数字水印
量化索引调制(QIM)
下载PDF
职称材料
基于anchor模型的说话人检索技术
6
作者
赵鸿滨
卢潇
李霞
《电脑知识与技术》
2007年第11期837-839,共3页
本文研究了基于anchor模型的说话人检索技术,提出了基于SCV分量方差和基于广义似然比聚类的模型剪枝方法.对基于序数比较的相似测度进行了改进,使SCV各分量的数值和比值都参与到识别中来,提高了检索性能。通过实验印证了将传统的说...
本文研究了基于anchor模型的说话人检索技术,提出了基于SCV分量方差和基于广义似然比聚类的模型剪枝方法.对基于序数比较的相似测度进行了改进,使SCV各分量的数值和比值都参与到识别中来,提高了检索性能。通过实验印证了将传统的说话人检索中的模型训练过程转变为计算语音相对于anchor说话人模型距离的映射过程.所带来的计算量和存储量的优势.为说话人检索在大型语音库和嵌入式系统的应用提出了新的思路:
展开更多
关键词
说话人检索
Anchor模型剪枝
GLR
GMM
下载PDF
职称材料
题名
在线无监督说话人检索中稳健的模型自举算法
被引量:
3
1
作者
付中华
张艳宁
机构
西北工业大学计算机学院
出处
《软件学报》
EI
CSCD
北大核心
2007年第3期608-616,共9页
基金
Supported by the Science & Technology Research and Development Plan of Shanxi Province of China under Grant No.2005k04G23(陕西省科学技术研究发展计划)
文摘
基于回归树模型的多特征空间建模方法在回归类内部进行特征音分析,较好地解决了训练数据不足时说话人模型的训练问题,而短语音段聚类策略又进一步避免了过短的语音片断对自举训练的影响.验证实验采用了实际录制的近8小时的不同谈话数据.结果显示,即使平均自举片断长度小于5秒,新方法依然非常稳健,不仅提高了说话人改变检测的效果,而且优于通常的自举方法.
关键词
说话人检索
说话人模型
回归类
特征音
Keywords
speaker index
ing
speaker
model
regression class
eigenvoice
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种三层判决的说话人索引算法
被引量:
1
2
作者
陈雪芳
杨继臣
机构
东莞理工学院计算机学院
仲恺农业工程学院计算机科学与工程学院
出处
《计算机工程》
CAS
CSCD
2012年第2期184-185,共2页
基金
东莞市2010年高等院校科研机构科技计划基金资助项目(201010814014)
文摘
为提高说话人索引准确率,提出一种三层判决的说话人索引算法。第1层使用惩罚距离公式对说话人改变进行检测,第2层采用说话人模型自举法进行初次说话人辨认,第3层采用GMM说话人超级矢量进行判决,解决说话人模型自举法中产生的数据不匹配问题。实验结果表明,采用惩罚距离公式,与贝叶斯信息判决方法相比不需调整参数,与DISTBIC方法相比F1值提高2%,使用GMM说话人超级矢量,在说话人索引准确率和数量准确率方面分别提高8.95%、18.25%。
关键词
三层判决
说话人索引
惩罚距离
模型自举法
GMM说话人超级矢量
Keywords
three-layer criterion
speaker index
penalty distance
model bootstrapping method
GMM
speaker
Supervector(GMMSS)
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种基于性别的说话人索引算法
3
作者
杨继臣
何俊
李艳雄
机构
仲恺农业工程学院计算机科学与工程学院
华南理工大学电子与信息学院
出处
《计算机工程与科学》
CSCD
北大核心
2012年第6期79-82,共4页
基金
广东省自然科学基金资助项目(10451064101004651)
中央高校基本科研业务费专项资金资助项目(2011ZM0029)
文摘
为了提高说话人索引准确率,对说话人改变判决中常用的贝叶斯信息判决(BIC)进行改进和在说话人辨认中使用性别信息,提出了一种基于性别的说话人索引算法。首先使用惩罚距离公式对说话人改变进行检测,解决了在说话人改变判决中使用BIC需要不断调节惩罚因子的问题;其次在说话人改变检测的基础上,采用性别模型判断每个说话人的性别;最后把男性和女性说话人分别对待,使用说话人模型自举法对说话人进行辨认。实验结果表明:在说话人改变检测中,采用惩罚距离公式,和BIC相比不需要调整参数,和DISTBIC相比,在F1方面提高了2%;在说话人辨认方面,利用性别信息,说话人索引准确率(SIA)提高了20.93%,说话人数量准确率(SNA)方面提高了3%。
关键词
说话人索引
性别信息
说话人模型自举法
Keywords
speaker index
ing
gender information
speaker
model bootstrapping
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
远程教学数字图书馆中基于MPEG-7的语音数据的组织索引
被引量:
1
4
作者
卢坚
杨文清
陈毅松
张福炎
机构
南京大学计算机科学与技术系
出处
《情报学报》
CSSCI
北大核心
2002年第4期407-412,共6页
基金
国家自然科学基金 (6 990 30 0 6 )
文摘
本文提出基于MPEG 7的教学语音内容的描述模式 ,它是语音数据的层次结构化组织和多维索引的重要依据。描述模式为用户提供了层次结构的浏览视图和导航机制 ,以及反映用户多角度观察和分析的多维索引 ,从而实现互操作性的基于内容的语音检索等服务。最后本文概要地分析了特征的自动提取和描述的自动生成技术。
关键词
远程教学
数字图书馆
MPEG-7
描述模式
层次式组织
多维索引
跨模态信息检索
教学语音数据
Keywords
distance learning digital library,MPEG\|7,description scheme,content based retrieval,hierarchical organization,multi\|dimension
index
ing,cross\|modal information retrieval,
speaker
\|based speech clustering.
分类号
G252.6 [文化科学—图书馆学]
下载PDF
职称材料
题名
基于数字水印的人脸与声纹融合识别算法
被引量:
6
5
作者
王骕
胡浩基
于慧敏
DAMPER R I
机构
浙江大学信息与电子工程学系
南安普顿大学电子与计算机科学系
出处
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2015年第1期6-14,共9页
基金
国家自然科学基金资助项目(61202400)
文摘
提出远程多模态的生物特征数字水印算法,将声音特征作为水印加入到人脸图像中.运用文献[1]提出的改进型量化索引调制(QIM)方法,算法加入一个脆弱型的水印用于篡改检测,同时加入一个鲁棒型水印用于隐藏声音的高斯混合模型(GMM)参数.利用人脸、声纹和多模态识别算法,提出的方法能够实现对篡改的检测,对常见的攻击,例如图片缩放、高斯噪声、模糊化、伽马校正和JPEG压缩等具有鲁棒性.在由295人组成的XM2VTS数据库上,该多模态系统能够获得95.93%的识别率,同时获得3.19%的等错误率.
关键词
人脸识别
声纹识别
数字水印
量化索引调制(QIM)
Keywords
face recognition
speaker
recognition
digital watermarking
quantization
index
modulation(QIM)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于anchor模型的说话人检索技术
6
作者
赵鸿滨
卢潇
李霞
机构
空军工程大学电讯工程学院
出处
《电脑知识与技术》
2007年第11期837-839,共3页
文摘
本文研究了基于anchor模型的说话人检索技术,提出了基于SCV分量方差和基于广义似然比聚类的模型剪枝方法.对基于序数比较的相似测度进行了改进,使SCV各分量的数值和比值都参与到识别中来,提高了检索性能。通过实验印证了将传统的说话人检索中的模型训练过程转变为计算语音相对于anchor说话人模型距离的映射过程.所带来的计算量和存储量的优势.为说话人检索在大型语音库和嵌入式系统的应用提出了新的思路:
关键词
说话人检索
Anchor模型剪枝
GLR
GMM
Keywords
speaker index
ing: Anehor models
pruning algorithm
GLR
GMM
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
在线无监督说话人检索中稳健的模型自举算法
付中华
张艳宁
《软件学报》
EI
CSCD
北大核心
2007
3
下载PDF
职称材料
2
一种三层判决的说话人索引算法
陈雪芳
杨继臣
《计算机工程》
CAS
CSCD
2012
1
下载PDF
职称材料
3
一种基于性别的说话人索引算法
杨继臣
何俊
李艳雄
《计算机工程与科学》
CSCD
北大核心
2012
0
下载PDF
职称材料
4
远程教学数字图书馆中基于MPEG-7的语音数据的组织索引
卢坚
杨文清
陈毅松
张福炎
《情报学报》
CSSCI
北大核心
2002
1
下载PDF
职称材料
5
基于数字水印的人脸与声纹融合识别算法
王骕
胡浩基
于慧敏
DAMPER R I
《浙江大学学报(工学版)》
EI
CAS
CSCD
北大核心
2015
6
下载PDF
职称材料
6
基于anchor模型的说话人检索技术
赵鸿滨
卢潇
李霞
《电脑知识与技术》
2007
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部