基于生成对抗网络的混合类型数据生成方法被引量：1

MIXED TYPE DATA GENERATION METHOD BASED ON GENERATIVE ADVERSARIAL NETWORKS

下载PDF

导出

摘要为解决由于隐私保护政策中研究人员在获取训练数据时经常受到限制而导致训练数据集匮乏问题,提出一种基于生成对抗网络(Generative Adversarial Networks,GANs)的混合数据(数值和标签)生成模型(mixGAN)用来生成符合真实数据分布的合成数据,以此作为真实数据的补充并增加可用样本的数量。该模型使用预训练的自编码器(Autoencoder)将给定数据集映射到低维连续空间;通过在低维空间中的生成器和原始数据空间中的鉴别器进行对抗学习从而获得具有模拟真实数据的生成模型。通过从属性独立分布和多属性相关性两个方面对生成算法性能进行评估,表明所提出算法比目前其他基于深度学习的生成算法能更好地保持原始数据的分布结构。 In the privacy protection policy,researchers are often restricted in obtaining training data,resulting in a lack of training data sets.To solve this problem,we propose a mixed data generation model(mixGAN)based on generative adversarial networks(GANs)to generate synthetic data that conforms to the real data distribution.It can supplement the real data and increase the number of available samples.The model pre-trained the autoencoder which mapped the given data set into a low-dimensional continuous space.Adversarial learning was performed by the generator in the low-dimensional space and the discriminator in the original data space,so as to obtain the generative model with the simulated real data.We evaluated the proposed method both in the independent distribution of the attribute and in the relationship of the attributes.The experiment results show that the proposed method has a better performance in preserve the distribution structure of the original data compared with other generation methods based on deep learning.

作者魏宁汪龙志董方敏 Wei Ning;Wang Longzhi;Dong Fangmin(School of Computer and Information,China Three Gorges University,Yichang 443002,Hubei,China)

机构地区三峡大学计算机与信息学院

出处《计算机应用与软件》北大核心 2022年第6期29-34,共6页 Computer Applications and Software

基金国家自然科学基金项目(61871258)。

关键词生成对抗网络自编码器混合类型数据 Generative adversarial network Autoencoder Mixed type data

分类号 TP186 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1王忠,殷建立.大数据环境下个人数据隐私泄露溯源机制设计[J].中国流通经济,2014,28(8):117-121. 被引量：17
2牛斌,吴鹏,马利,刘景巍.一种基于生成对抗网络的行为数据集扩展方法[J].计算机技术与发展,2019,29(7):43-48. 被引量：9
3赵树阳,李建武.基于生成对抗网络的低秩图像生成方法[J].自动化学报,2018,44(5):829-839. 被引量：23
4李凯旋,曹林,杜康宁.基于双层生成对抗网络的素描人脸合成方法[J].计算机应用与软件,2019,36(12):176-183. 被引量：1

二级参考文献26

1袁文秀,余恒鑫.关于网络信息生态的若干思考[J].情报科学,2005,23(1):144-147. 被引量：47
2维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].杭州:浙江人民出版社,2013:5-25.
3K.M. Karlsen,B.Dreyer. Literature Review:Does aCommon Theoretical Framework to Implement Food Traceabili-ty Exist-[J].Food Control,2013,32:409-417.
4Gordon Jenny,Wiseman Louise.Guidelines for the Useof Personal Data in System Testing[M].British Standards Institu-tion,2003:17-23.
5C.Goble. Position Statement:Musings on Provenance,Workflow and(Semantic Web)Annotations for Bioinformatics[C]. Proc of Workshop on Data Derivation and Provenance,2002:1-5.
6Freeman RE.. The Politics of Stakeholder Theory:Some Future Directions[J]. Business Ethics Quarterly,1994:409-421.
7凡菊,姜元春,张结魁.网络隐私问题研究综述[J].情报理论与实践,2008,31(1):153-157. 被引量：26
8李树涛,魏丹.压缩传感综述[J].自动化学报,2009,35(11):1369-1377. 被引量：205
9蒋骁,仲秋雁,季绍波.网络隐私的概念、研究进展及趋势[J].情报科学,2010,28(2):305-310. 被引量：21
10明华,张勇,符小辉.数据溯源技术综述[J].小型微型计算机系统,2012,33(9):1917-1923. 被引量：49

共引文献44

1严慧,刘晶晶.大数据时代隐私保护研究的前沿议题与演进趋势——基于国内外文献比较的可视化分析[J].政府管理评论,2022(1):128-148.
2王星凯,邓浩江,盛益强.基于深度学习的智能推荐系统综述[J].网络新媒体技术,2021(1):1-11. 被引量：9
3谢楚鹏,温孚江.大数据背景下个人数据权与数据的商品化[J].电子商务,2015,16(10):32-34. 被引量：18
4王少辉,印后杰.基于政府管理视角的大数据环境下个人信息保护问题研究[J].中国行政管理,2015(11):19-24. 被引量：27
5迟晨阳,毛华坚,孟海滨,赵东升.电子健康档案信息安全和隐私保护的关键问题和研究进展[J].中华医学图书情报杂志,2015,24(11):22-26. 被引量：21
6马灿.大数据环境下的用户隐私保护及其对策研究[J].图书情报导刊,2016,1(5):96-98. 被引量：2
7崔晓鸾,赵可云.大数据在教育领域的研究热点及发展趋势——基于共词分析的可视化研究[J].现代远距离教育,2016(4):79-85. 被引量：32
8吕登龙,朱诗兵.大数据及其体系架构与关键技术综述[J].装备学院学报,2017,28(1):86-96. 被引量：9
9张聪丛,郜颍颍,赵畅,杜洪涛.开放政府数据共享与使用中的隐私保护问题研究——基于开放政府数据生命周期理论[J].电子政务,2018(9):24-36. 被引量：58
10何培育,王潇睿.智能手机用户隐私安全保障机制研究——基于第三方应用程序“隐私条款”的分析[J].情报理论与实践,2018,41(10):40-46. 被引量：30

同被引文献10

1李宏亮,贾茹,张悦,潘顺良.一种航天器测试注入数据序列自动生成方法[J].航天器工程,2020,29(1):93-99. 被引量：7
2董绍江,杨舒婷,刘伟,蒙志强.基于改进蚁群算法的Zigbee网络路由优化研究[J].组合机床与自动化加工技术,2020(3):60-64. 被引量：6
3廖伟志,夏小云,贾小军.基于蚁群算法的多路径覆盖测试数据生成[J].电子学报,2020,48(7):1330-1342. 被引量：20
4王曙燕,张海清,孙家泽.改进教与学算法的两两组合测试数据生成[J].西安邮电大学学报,2020,25(2):41-45. 被引量：4
5张静,李维刚,张骏虎,聂鹏,张传庄.基于卡尔曼滤波的MIMU姿态解算算法研究[J].计算机测量与控制,2020,28(12):233-237. 被引量：9
6陈孝文,郭威,王岩,邢文冠,林树鸿,陈宁.集中模式下电力信息化数据自动生成系统设计[J].电子设计工程,2020,28(24):104-107. 被引量：6
7摆世彬,严明辉,徐伟,蒙金有,孙小湘,周海锋.含大规模风电集群电网的在线计算数据生成技术[J].电力系统保护与控制,2021,49(3):66-73. 被引量：8
8郑岩,罗强,王海宝,王昌洪.自适应概率选择模型的改进蚁群算法研究[J].自动化技术与应用,2021,40(2):6-10. 被引量：6
9林若钦,罗琼.基于节点逻辑度优化的软件测试序列生成仿真[J].计算机仿真,2021,38(4):390-394. 被引量：2
10刘博省,毛范海,钱峰.蚁群禁忌搜索融合算法求解调度问题[J].机械设计与制造,2021(9):228-230. 被引量：5

引证文献1

1张金波,梁哲恒,曾纪钧,郑杰生,赵创业.基于优化蚁群算法的软件测试数据自动生成方法[J].自动化技术与应用,2024,43(11):88-92.

1陈培文.2022年中职学校汽车专业新型乡土人才培养模式研究[J].汽车知识,2022,22(2):126-128.
2马占方.浅谈节水灌溉与水利管理制度[J].农业科技与信息,2022(12):85-88. 被引量：4
3Felda Zakri,KI(摄影),EMario Wibowo(摄影),郭映琴(译),Partogi Pandiangan,Leviandri.Tanatap环形花园咖啡厅[J].现代装饰,2022(2):46-53.
4杜斐.基于“1+X”证书的高职旅游管理专业人才培养研究[J].齐齐哈尔师范高等专科学校学报,2022(3):129-131. 被引量：6
5李然.论早期党校人才培养的特点与作用[J].职业,2022(11):94-96.
6李瑞鑫.市政污水处理工艺与回用技术分析[J].清洗世界,2022,38(4):64-66. 被引量：3
7Sizhou Wei,Zhiyuan Chen,Senthil Kumar Arumugasamy,Irene Mei Leng Chew.Data augmentation and machine learning techniques for control strategy development in bio-polymerization process[J].Environmental Science and Ecotechnology,2022(3):40-48. 被引量：2
8雷育杰,陈明焕,王洁瑶,陈旺治,李磊.回收聚乙烯的交联发泡及其产品性能研究[J].中国塑料,2022,36(6):124-129.
9吴德垠.闭模糊拟阵导出独立集的等价描述[J].吉林大学学报（理学版）,2022,60(3):514-520.
10邹裕吉,宋豫川,王毅,王馨坤.基于离散型鲸鱼优化算法的AGV与机器集成调度方法[J].重庆大学学报,2022,45(6):55-74. 被引量：5

计算机应用与软件

2022年第6期

浏览历史

内容加载中请稍等...

基于生成对抗网络的混合类型数据生成方法被引量：1

参考文献4

二级参考文献26

共引文献44

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于生成对抗网络的混合类型数据生成方法 被引量：1

参考文献4

二级参考文献26

共引文献44

同被引文献10

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于生成对抗网络的混合类型数据生成方法被引量：1