期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
矢量量化正则变分自编码器做非平行语料语音转换 被引量:4
1
作者 王超 俞一彪 《信号处理》 CSCD 北大核心 2021年第7期1339-1345,共7页
基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究的一大热点,但是其较差的转换音质限制了模型的应用。本文在VQVAE的基础上提出一种改进的矢量量化正则变分自编码器(... 基于矢量量化变分自编码器(Vector Quantized Variational Autoencoder,VQVAE)的语音转换系统是国内外语音转换领域研究的一大热点,但是其较差的转换音质限制了模型的应用。本文在VQVAE的基础上提出一种改进的矢量量化正则变分自编码器(Vector Quantization Regularized Variational Autoencoder,VQ-REG-VAE)。在训练时,矢量量化退化为正则化项,通过矢量量化的正则约束让编码器学习生成说话人无关的语义特征,同时让解码器学习将说话人特征融合到语义特征中。在转换时,可以去掉矢量量化这一正则化项,通过编码器和解码器就能实现语音转换。由于转换时没有进行矢量量化,语义特征信息得以更好保留。客观和主观实验都表明:基于VQ-REG-VAE模型的转换语音在不降低相似度的前提下,音质比VQVAE模型有显著的提升。 展开更多
关键词 语音转换 矢量量化 矢量量化正则自编码器
下载PDF
基于MELP的变速率语音编码器算法 被引量:1
2
作者 张博 朱杰 《电子测量技术》 2009年第2期12-14,共3页
描述了一种新的基于MELP算法的变速率语音编码器。其中,考察每一语音帧与其前一帧在以下4个方面的相关性:清浊音判定、基音周期、增益与线谱对频率,依相关性不同采用不同的量化方法以减少各帧之间的编码冗余。主观测试表明本编码器的语... 描述了一种新的基于MELP算法的变速率语音编码器。其中,考察每一语音帧与其前一帧在以下4个方面的相关性:清浊音判定、基音周期、增益与线谱对频率,依相关性不同采用不同的量化方法以减少各帧之间的编码冗余。主观测试表明本编码器的语音质量与美国联邦标准的2.4KB/SMELP编码器近似。 展开更多
关键词 速率语音编码器 混合激励线性预测 矢量量化
下载PDF
基于矢量量化编码的协同过滤推荐方法 被引量:2
3
作者 王冠宇 钟婷 +1 位作者 冯宇 周帆 《计算机科学》 CSCD 北大核心 2022年第9期48-54,共7页
随着互联网的高速发展,海量数据涌现,使得推荐系统成为计算机科学领域的研究热点。变分自编码器已经被成功应用于协同过滤方法的设计中,并取得了出色的推荐效果。然而,以往基于变分自编码器的推荐模型存在一些问题,如对隐变量先验分布... 随着互联网的高速发展,海量数据涌现,使得推荐系统成为计算机科学领域的研究热点。变分自编码器已经被成功应用于协同过滤方法的设计中,并取得了出色的推荐效果。然而,以往基于变分自编码器的推荐模型存在一些问题,如对隐变量先验分布的约束以及“后验失效”等,这些问题降低了推荐模型的性能。为了解决这一问题,使变分自编码器模型更加适用于推荐任务,提出了一种基于矢量量化编码的协同过滤推荐方法。该方法采用离散的矢量编码代替变分自编码器从隐变量分布中直接取样获得编码,从观测数据中学习到一个离散的潜在表示,提高了编码的表示能力。在多个公开数据集上的性能评测结果显示,与现有方法相比,所提方法能够有效提升推荐性能。 展开更多
关键词 推荐系统 协同过滤 矢量量化编码 自编码器
下载PDF
基于扩散变分自编码器的工业缺陷检测算法
4
作者 冯先哲 陈刚 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2024年第3期341-348,共8页
基于重建的检测算法在工业产品自动化缺陷检测中得到了广泛的应用。但是,很多算法重建的图像依然保留了较多的缺陷特征,从而导致检测精度不高。受扩散模型能够建立起噪声和生成图片之间的联系启发,提出了一种基于扩散变分自编码器的工... 基于重建的检测算法在工业产品自动化缺陷检测中得到了广泛的应用。但是,很多算法重建的图像依然保留了较多的缺陷特征,从而导致检测精度不高。受扩散模型能够建立起噪声和生成图片之间的联系启发,提出了一种基于扩散变分自编码器的工业产品缺陷检测算法。该算法将工业产品中的缺陷视为一种噪声,通过扩散模型的反向去噪过程重建正常图片。在训练阶段,首先利用预训练的基于矢量量化的变分自编码器(Vector Quantized Variational Autoencoder,VQ-VAE)提取工业产品图片的正常特征并添加噪声;然后,利用扩散模型在去噪的过程中消除缺陷特征并保留正常特征,以得到重建的正常图片;最后通过比较重建图片与对应的原始图片之间的差异来判断产品是否存在缺陷并定位缺陷区域。在测试阶段,将输入图片理解为已经添加噪声的图片进行缺陷检测。实验结果表明,该算法的检测精度较其他算法有明显提高。 展开更多
关键词 计算机视觉 缺陷检测 矢量量化的变分自编码器 扩散模型
原文传递
面向汉字矢量图形特征的字向量表征方法 被引量:2
5
作者 唐善成 鲁彪 +2 位作者 张雪 张莹 梁少君 《科学技术与工程》 北大核心 2023年第16期6967-6973,共7页
为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量(scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字... 为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量(scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字形矢量坐标对序列;特征学习阶段采用双向循环神经网络(recurrent neural network,RNN)和自回归混合密度循环神经网络构建矢量图形变分自编码器模型,利用模型学习汉字字形结构特征;向量生成阶段输入字形矢量坐标对序列到编码器,编码器将字形特征映射到概率连续分布空间,得到SVG2vec字向量。与已有字向量在不同层级任务上进行对比实验。结果表明:SVG2vec向量在命名实体识别、中文分词和短文本相似度计算实验中,F1均值比Word2vec、GloVe等未利用字形特征的向量分别提高了1.27、0.4,1.67、0.12,3.28、2.03,比GnM2Vec、CWE等利用字形特征的向量分别提高了1.02、1.07,1.69、1.34,0.04、0.31,SVG2vec能更有效利用汉字字形特征。 展开更多
关键词 汉字字形 矢量图形 字向量 自编码器
下载PDF
融合图卷积残差网络与边收缩池化的VQ-VAE网格重建算法
6
作者 丁阳 杨华民 +2 位作者 韩成 刘宇 卢时禹 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第10期112-121,共10页
3D网格因其复杂性和不规则性使其有效表示成为挑战。为解决常规图卷积难以对3D网格有效传递和融合信息的问题,提出基于变分量化自编码器的3D网格模型,以探索其隐空间并用于3D网格的生成。提出带残差的图卷积模块,在处理3D网格这种复杂... 3D网格因其复杂性和不规则性使其有效表示成为挑战。为解决常规图卷积难以对3D网格有效传递和融合信息的问题,提出基于变分量化自编码器的3D网格模型,以探索其隐空间并用于3D网格的生成。提出带残差的图卷积模块,在处理3D网格这种复杂的图结构时,残差连接更有效地整合多层特征信息,支持更深的网络结构,显著提升模型的性能和泛化能力。在网格简化的边收缩算法基础上构建了可靠的多层池化和反池化操作,有效编码了层次结构中较粗糙和较稠密网格之间的对应关系。将3D网格形状投影到潜在空间的过程中,潜在特征被过度压缩导致信息损失,采用向量量化将潜在特征映射到预先定义的离散向量,在保持紧凑表示下更有效地编码和重建数据。实验结果表明,所提算法能够学习对可变形形状集合的紧凑表示,且在形状生成、形状插值等各种应用中表现出色。 展开更多
关键词 网格生成 量化自编码器 网格插值 图卷积
下载PDF
基于点集匹配的缺陷样本图像生成方法 被引量:1
7
作者 高海洋 张明川 +1 位作者 葛泉波 刘华平 《智能系统学报》 CSCD 北大核心 2023年第5期1030-1038,共9页
针对工业缺陷检测中存在的由产品次品率过低、产品迭代更新过快、缺陷种类难以覆盖全部以及缺陷样本高质量标注难度较高导致的小样本问题,使用基于点集匹配的缺陷样本图像生成方法来对缺陷数据进行扩充。将缺陷部位从多特征角度进行变换... 针对工业缺陷检测中存在的由产品次品率过低、产品迭代更新过快、缺陷种类难以覆盖全部以及缺陷样本高质量标注难度较高导致的小样本问题,使用基于点集匹配的缺陷样本图像生成方法来对缺陷数据进行扩充。将缺陷部位从多特征角度进行变换,使用单张样本进行扩充得到不同特征的缺陷图像,解决小样本条件下深度学习方法难以生成高质量缺陷图像的问题。通过图像评估与实验验证,该方法生成的图像具有更好的视觉效果,并且对缺陷与分割模型有着高效的提升。该方法可应用于样本较少的深度学习模型训练过程中,达到扩充样本提高训练效果的目的。 展开更多
关键词 工业 缺陷检测 小样本问题 点集匹配 样本扩充 缺陷样本生成 有效训练 循环生成对抗网络模型 矢量分自编码器
下载PDF
面向未知域场景的车辆轨迹预测模型
8
作者 卢一凡 李煊鹏 薛启凡 《智能系统学报》 2024年第5期1238-1247,共10页
自动驾驶技术随着科技革新迎来蓬勃发展,轨迹预测已成为智能汽车软件系统不可或缺的关键组成部分。为了解决传统车辆轨迹预测模型中存在的泛化能力不足的问题,提出一种基于泛化终点预测和地图场景的车辆轨迹预测方法。该方法采用基于不... 自动驾驶技术随着科技革新迎来蓬勃发展,轨迹预测已成为智能汽车软件系统不可或缺的关键组成部分。为了解决传统车辆轨迹预测模型中存在的泛化能力不足的问题,提出一种基于泛化终点预测和地图场景的车辆轨迹预测方法。该方法采用基于不变风险最小化的条件变分自编码器生成轨迹终点,并结合时序网络编码的地图场景特征,提升了模型预测未知域数据的准确率。在交互式道路场景数据集INTERACTION上的实验结果证明该模型具有良好的泛化性能。本方法与效果最好的方法REx相比1、2、3 s处的mADE值(越小越好)分别下降0%、36.59%、50.68%,在未知测试域的预测轨迹准确度得到显著提升。 展开更多
关键词 轨迹预测 域泛化 风险最小化 条件自编码器 端点生成 矢量地图 场景上下文 时序网络
下载PDF
信息理论与技术
9
《电子科技文摘》 2006年第9期47-51,共5页
0623152基于Canny算子的改进的图像边缘检测方法[刊,中]/梅跃松//激光与红外,—2006,36(6).—501-503(G) 0623153弹载红外图像实时编码器的设计[刊,中]/龚志红//激光与红外.—2006,36(6).—456-458(G)设计了适用于某型号导弹红外图... 0623152基于Canny算子的改进的图像边缘检测方法[刊,中]/梅跃松//激光与红外,—2006,36(6).—501-503(G) 0623153弹载红外图像实时编码器的设计[刊,中]/龚志红//激光与红外.—2006,36(6).—456-458(G)设计了适用于某型号导弹红外图像实时传输系统的关键部件图像数据编码器。为保证编码器的各项性能指标达到弹载设备的严格要求,本文重点在体系结构设计、芯片选型、PCB设计、系统抗干扰能力增强等几方面采取了多项针对性措施。设计与测试结果表明,该编码器结构简单,体积小,质量轻,功耗低,满足导弹研制任务对图像编码分系统各项指标要求。在工程实用中,该编码器性能稳定,工作可靠。参1 0623154主振-功放系统SBS位相共轭技术研究[刊,中]/秘国江//激光与红外.—2006,36(6).—445-447,451(G) 展开更多
关键词 电声技术 信道估计 实时编码器 认证加密方案 电子工程 潜通路析技术 语音质量客观评价 多径信道 参信道 密码学 频率选择性信道 矢量量化算法 叛逆者追踪
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部