基于编码-解码技术的图像标题生成方法分析

Analysis of image title generation method based on encoding decoding technology

下载PDF

导出

摘要文章首先介绍了图像标题生成的常用方法,包括模板法、检索法、编码-解码法;其次,在互助双向LSTM模型的基础上,详细介绍了图像标题生成算法的实现步骤,即利用Inception-V4编码器将原始图像编码成图像特征,并使用互助双向LSTM解码器将这些特征解码成相应的句子,同时采用语音混沌保密通信技术确保信息安全;最后,进行了实验测试,并通过多模态注意力可视化分析验证了递进解码机制的作用。实验结果显示,在LSTM解码机制的支持下,能够生成优质、精确的图像标题。 Firstly,this paper introduces the common methods of image title generation,including template method,retrieval method and encoding decoding method.Secondly,based on the mutual aid two-way LSTM model,the implementation steps of the image title generation algorithm are introduced in detail,that is,the original image is encoded into image features by using the perception-v4 encoder,and these features are decoded into corresponding sentences by using the mutual aid two-way LSTM decoder.At the same time,the speech chaotic secure communication technology is used to ensure information security.Finally,experimental tests are carried out,and the role of progressive decoding mechanism is verified by multimodal attention visualization analysis.Experimental results show that with the support of LSTM decoding mechanism,it can generate high-quality and accurate image titles.

作者王彬燕 WANG Binyan(Beijing Hangxing Yongzhi Technology Co.,Ltd.,Beijing 100010,China)

机构地区北京航星永志科技有限公司

出处《计算机应用文摘》 2024年第5期110-112,共3页 Chinese Journal of Computer Application

关键词编码-解码技术图像标题生成技术保密通信 encoding and decoding technology image title generation technology confidential communication

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1唐秋玲,覃团发,姚海涛,林硒.数字语音混沌保密通信系统的研究[J].广西大学学报（自然科学版）,2000,25(1):61-63. 被引量：5
2颜珏明,甘秋业.基于WiFi的实时语音混沌保密通信的实现[J].电子制作,2014,22(24):124-125. 被引量：1
3杨润霞,邵洁,罗岩,白万荣.基于编解码器的电力施工场景可控图像字幕生成[J].电网技术,2022,46(7):2572-2580. 被引量：1

二级参考文献16

1覃团发,唐秋玲,邓浩,倪皖荪.语声混沌保密通信[J].广西大学学报（自然科学版）,1998,23(3):203-206. 被引量：2
2唐秋玲,覃团发,陈光旨.混沌图象加密[J].广西大学学报（自然科学版）,1999,24(1):61-64. 被引量：14
3李宁.Wi-Fi技术在家庭无线网络中的应用研究[J].数字技术与应用,2012,30(4):37-37. 被引量：5
4禹思敏,丘水生.基于超混沌的保密通信系统[J].电波科学学报,2001,16(2):266-270. 被引量：8
5禹思敏,林清华,丘水生.混沌反馈调制语音保密通信系统[J].通信技术,2001(7):74-77. 被引量：1
6张明媛,曹志颖,赵雪峰,杨震.基于深度学习的建筑工人安全帽佩戴识别研究[J].安全与环境学报,2019,19(2):535-541. 被引量：58
7杨莉琼,蔡利强,古松.基于机器学习方法的安全帽佩戴行为检测[J].中国安全生产科学技术,2019,15(10):152-157. 被引量：28
8徐守坤,倪楚涵,吉晨晨,李宁.一种基于安全帽佩戴检测的图像描述方法研究[J].小型微型计算机系统,2020,41(4):812-819. 被引量：16
9张卫国,马静瑞.基于局部和全局特征融合的显著性检测[J].计算机工程与设计,2020,41(6):1714-1718. 被引量：1
10徐守坤,吉晨晨,倪楚涵,李宁.融合施工场景及空间关系的图像描述生成模型[J].计算机工程,2020,46(6):256-265. 被引量：3

共引文献4

1李兴华,高飞.一种基于网络的语音混沌加密算法[J].电讯技术,2007,47(4):110-114. 被引量：3
2马海燕,高飞,李兴华.基于网络传输的语音数据混沌加密算法[J].计算机工程,2008,34(8):190-192. 被引量：2
3傅慧.Logistic混沌网络会议加密系统的设计[J].计算机与数字工程,2009,37(7):107-109. 被引量：1
4唐秋玲,姚海涛,覃团发.采用时空混沌耦合映象格子产生混沌扩频序列[J].广西大学学报（自然科学版）,2002,27(1):87-90. 被引量：8

1陈林,张颖君,李巧,刘莉,石梅.血液透析血管通路护理质量评价指标体系的构建[J].中华现代护理杂志,2024,30(5):604-609.
2胡尧,李红莲,王赏玉,杨柳.辐射数据缺失时TMY与逐时值生成方法分析[J].哈尔滨工业大学学报,2022,54(6):163-170. 被引量：2

计算机应用文摘

2024年第5期

浏览历史

内容加载中请稍等...

基于编码-解码技术的图像标题生成方法分析

参考文献3

二级参考文献16

共引文献4

相关作者

相关机构

相关主题

浏览历史