基于变分自编码器潜变量语义提炼的样本生成方法被引量：1

Virtual Sample Generation Method Based on Semantic Meaning Extraction of VAE’s Latent Variables

下载PDF

导出

摘要人工智能的逐步应用对行业的生产效率和技术变革影响显著,传统行业因样本收集难度大、成本高、涉及个人隐私等原因,进行深度学习时,面临着小样本和不平衡数据问题.现有的样本扩充方法存在着生成效果不能兼顾广泛性和合理性等问题.为此,提出一种基于变分自编码器潜变量语义提炼的样本扩充算法,利用神经网络的权重作为输入特征与潜变量相关性的度量,获取输入特征与变分自编码器潜变量的依赖关系,为潜变量赋予语义提供重要依据,实现显式控制潜变量的不同维度,生成满足总体分布且在原训练集未包含的样本.在对民用建筑结构安全数据库的样本扩充结果表明,该方法能有效生成特定属性的样本,能一定程度上解决小样本问题和不平衡数据问题. The application of artificial intelligent has been stimulating the productivity and technological revolution of industries. Traditional industries are facing small sample and imbalanced data problems due to the rarity nature of sample,cost and privacy issues. However, the sample generation results of existing methods are often limited to balancing generalization and validity. The purposed semantic meaning extraction of VAE’s latent variables based virtual sample generation method utilized the weights of encoder neural network as the measurement of dependency between input features and the latent variables. This method achieves flexible sample generation by controlling various dimensions of latent variables explicitly. The generated samples which satisfy the population distribution are not necessarily included in the original samples. The results of sample expansion of civil buildings structural safety databases show that the proposed method is capable of controllable generation of valid samples, and mitigating the problems of small sample and imbalanced data.

作者王俊杰焦柯彭子祥谭丽红王文波 WANG Jun-Jie;JIAO Ke;PENG Zi-Xiang;TAN Li-Hong;WANG Wen-Bo(Guangdong Architectural Design and Research Institute Co.Ltd.,Guangzhou 510010,China)

机构地区广东省建筑设计研究院有限公司

出处《计算机系统应用》 2022年第3期255-261,共7页 Computer Systems & Applications

基金住房和城乡建设部2019年科学技术计划(2019-K-157)。

关键词变分自编码器语义提炼虚拟样本生成小样本数据不平衡数据 variational autoencoder(VAE) semantic meaning extraction virtual sample generation small sample imbalanced data

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1尹爱军,王昱,戴宗贤,任宏基.基于变分自编码器的轴承健康状态评估[J].振动．测试与诊断,2020,40(5):1011-1016. 被引量：20
2王劭菁,马文嘉,王丰华,崔律,周行星.基于虚拟样本生成技术与概率神经网络的接地网故障诊断[J].高压电器,2020,56(6):309-316. 被引量：16
3于旭,杨静,谢志强.虚拟样本生成技术研究[J].计算机科学,2011,38(3):16-19. 被引量：16
4温津伟,罗四维,赵嘉莉,黄华.通过创建虚拟样本的小样本人脸识别统计学习方法[J].计算机研究与发展,2002,39(7):814-818. 被引量：9

二级参考文献56

1温津伟,罗四维,赵嘉莉,黄华.通过创建虚拟样本的小样本人脸识别统计学习方法[J].计算机研究与发展,2002,39(7):814-818. 被引量：9
2张莉,陈恭和.入侵检测系统中训练样本集的构造方法[J].计算机工程与应用,2006,42(28):145-146. 被引量：6
3[1]M Kirby, L Sirovich. Application of the Karhunen-Loeve procedure for the characterization of human faces. IEEE Trans on Pattern Analysis and Machine Intelligence, 1990, 12(1): 103～108
4[2]K Fukunaga. Introduction to Statistical Pattern Recognition. New York: Academic Press, 1991
5[3]P N Belhumeur, J P Hespanha, D J Kriegman. Eigenfaces vs fisherfaces: Recognition using class specific linear projection. IEEE Trans on Pattern Analysis and Machine Intelligence, 1997, 19(7): 711～720
6[4]Liu Chenjun, H Wechsler. Probabilistic reasoning models for face recognition. In: Proc of the 1998 IEEE Computer Society Conf on CVPR. Santa Barbara, 1998. 827～832
7[6]Pawan Sinha. Object recognition via image invariances. Investigative Ophthalmology and Visual Science, 1994, 35(4): 1626～1643
8[7]D Beymer, T Poggio. Face recognition from one example view. In: Proc of the Int'l Conf of Computer Vision. Cambridge, MA, 1995. 500～507
9[8]M Turk, A Pentland. Eigenfaces for recognition. Journal of Cognitive Neuroscience, 1991, 13(1): 71～86
10[9]Dempster, Laird, Rubin. Maximum-likelihood from incomplete data via the EM algorithm. Journal of Royal Statistical Society, 1977, B, 39(1): 1～38

共引文献55

1刘连胜,张晗星,刘晓磊,王璐璐,梁军.面向飞机辅助动力装置在翼剩余寿命预测的性能参数扩增方法[J].仪器仪表学报,2020(7):107-116. 被引量：12
2程晓玉,韩鹏,贺维,张朋,韩晓霞,李英梅,曹友.一种新的基于可解释性置信规则库的飞轮健康状态评估模型[J].航空学报,2023,44(S01):177-189.
3王科俊,段胜利,冯伟兴.单训练样本人脸识别技术综述[J].模式识别与人工智能,2008,21(5):635-642. 被引量：23
4于旭,杨静,谢志强.虚拟样本生成技术研究[J].计算机科学,2011,38(3):16-19. 被引量：16
5付雅冰,徐晓.用于七段码识别的BP网络中虚拟样本的生成[J].传感器与微系统,2012,31(3):89-91.
6罗晓琳.一种抽取真实虚拟样本进行辅助训练的新分类算法[J].科技通报,2013,29(6):107-109. 被引量：1
7俞庆生.一种基于权重选择虚拟样本的新分类算法[J].计算机应用与软件,2013,30(7):280-282. 被引量：3
8方蔚涛,吴凡.B样条和图像梯度的单样本人脸识别[J].重庆大学学报（自然科学版）,2013,36(12):111-116. 被引量：1
9黄宏博,穆志纯.小训练样本的人脸识别研究[J].软件,2014,35(3):167-169. 被引量：8
10易令,吕忠元,丁进良,刘长鑫.面向原油总氢物性预测的数据扩增预处理方法[J].控制与决策,2018,33(12):2153-2160. 被引量：6

同被引文献4

1李会鹏,贺国,明廷锋.Bootstrap方法在机电设备振动状态阈值设定中的应用[J].舰船科学技术,2012,34(5):70-73. 被引量：3
2康士伟,孙水发,陈晓军,魏晓燕.单帧图像超分辨率重建的深度神经网络综述[J].信息通信,2019,32(3):24-27. 被引量：3
3梁俊杰,韦舰晶,蒋正锋.生成对抗网络GAN综述[J].计算机科学与探索,2020,14(1):1-17. 被引量：75
4杨天乐,钱寅森,武威,孙成明,刘涛.基于Python爬虫和特征匹配的水稻病害图像智能采集[J].河南农业科学,2020,49(12):159-163. 被引量：10

引证文献1

1费加杰,杨毅,曾晏林,蔺瑶,贺壹婷,黎强,张圣笛.融合注意力机制的GAN病虫害图像超分辨率重建[J].湖北农业科学,2024,63(9):204-209.

1叶枫,朱彩霞.基于聚类融合和过采样的不平衡金融模型研究[J].上海管理科学,2022,44(2):36-42.
2史智超.数据库安全分析与优化[J].黑龙江广播电视技术,2021(3):96-97.
3郑鹏飞,杨洋,石鑫,闻小虎.Stacking算法在小样本预测上的适用性研究:以实验室金属挂片的腐蚀速率预测为例[J].电子测试,2022,36(1):48-50.
4郑吉喆.移动互联网业态经营模式下劳动者与平台之间的法律关系如何认定?[J].民主与法制,2022(12):58-59.
5唐迪克.媒体融合视角下播音主持发展研究[J].中国地市报人,2022(4):87-89. 被引量：9
6郭小萍,尹瑞琛,李元.基于MDP-SVM的过程多类型故障诊断[J].电子测量技术,2022,45(1):159-164. 被引量：4
7张志博,康达周.基于变分自编码器的实验设计[J].计算机系统应用,2022,31(3):113-121.
8尤思思.有效生成游戏活动的基本策略[J].山东教育,2022(5):63-65.
9肖臻泉,普拉提·莫合塔尔,安朝高.基于POI数据的新疆农家乐空间分布特征及影响因素研究[J].西南大学学报（自然科学版）,2022,44(4):144-154. 被引量：14
10张太钢.浅析制造业企业财务管理存在的问题和对策[J].大众投资指南,2021(24):103-105. 被引量：2

计算机系统应用

2022年第3期

浏览历史

内容加载中请稍等...

基于变分自编码器潜变量语义提炼的样本生成方法被引量：1

参考文献4

二级参考文献56

共引文献55

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于变分自编码器潜变量语义提炼的样本生成方法 被引量：1

参考文献4

二级参考文献56

共引文献55

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于变分自编码器潜变量语义提炼的样本生成方法被引量：1