-
题名基于类混合高斯映射的归纳式广义零样本识别
- 1
-
-
作者
白万荣
张驯
张蕾
杨凡
邵洁
-
机构
国网甘肃省电力公司电力科学研究院
-
出处
《计算机应用与软件》
2024年第11期206-212,共7页
-
基金
国家自然科学基金项目(61802250)
国网甘肃省电力公司2019科技开发项目。
-
文摘
在广义零样本识别研究中,分类器对可见类别的偏倚以及在高维向低维特征映射过程中产生的信息丢失是传统算法常见的两大问题。为了解决上述问题,基于高斯混合分布模型的思想,结合共同学习的设计理念,提出一种加权多通道结构,不仅能够通过建立通道学习速率差异化实现通道间有监督的共同学习,而且可以通过类多高斯分布的计算拟合生成特征的真实分布特性,增强网络在隐藏空间的特征映射能力。针对三个常用数据库CUB、AWA2和SUN进行测试后,实验结果表明,基于多通道和生成对抗网络建立的类混合高斯映射网络模型针对上述三个数据库调和指标H分别提高了1.4、1.56和0.47,验证了这种加权多通道结构实现的类混合高斯映射模型在广义零样本图像识别领域的有效性。
-
关键词
广义零样本识别
归纳式
高斯混合映射
多通道结构
图像识别
-
Keywords
Generalized zero-shot learning
Inductive
Gaussian mixture liked mapping
Multi-channel structure
Image recognition
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名一种使用声调映射码本的汉语声音转换方法
被引量:4
- 2
-
-
作者
左国玉
刘文举
阮晓钢
-
机构
中国科学院自动化所模式识别国家重点实验室
北京工业大学电子信息与控制工程学院
-
出处
《数据采集与处理》
CSCD
北大核心
2005年第2期144-149,共6页
-
基金
国家自然科学基金(60172055
60121302)资助项目
北京市自然科学基金(4042025)资助项目。
-
文摘
在使用高斯混合模型实现说话人语音频谱包络变换的同时,提出了一种汉语声调码本映射技术来进一步提高转换语音目标说话人特征倾向性的方法。从源语音和目标语音分别提取汉语单音节的基频曲线作为基频变换单元,作预处理和聚类后分别形成源、目标声调码本,根据时间对准原则建立了一个由源特征空间到目标特征空间的声调模式映射码本。声音转换实验评估了声调码本映射算法的性能。实验结果表明,该算法较好地反映出源说话人与目标说话人基频曲线之间的映射关系,改善了声音转换性能。
-
关键词
声音转换
声调映射码本
混合高斯映射
-
Keywords
voice conversion
tone mapping codebook
mixture Gaussian mapping
-
分类号
TN912.3
[电子电信—通信与信息系统]
-