基于深度传播融合生成对抗网络的文本生成图像算法

Text-to-Image Synthesis Algorithm Based on GANs with Deeply Propagated Fusion

下载PDF

导出

摘要基于深度融合生成对抗网络(DF-GAN)多个融合模块相互独立,以致网络融合深度较浅并难以得到最优融合结果的问题,本文提出了一种基于深度传播融合生成对抗网络(DPF-GAN)的文本生成图像算法。该算法通过拼接相邻的仿射模块和融合模块,让前面的融合信息传播至后面的融合模块中,从而促进文本和图像更深层次地融合。实验表明,在CUB-200-2011和COCO数据集上,DPF-GAN生成的图像质量要优于DF-GAN,特别是CUB-200-2011数据集的FID指标减少了11.34%。与递归仿射变换生成对抗网络(RAT-GAN)相比,DPF-GAN的空间复杂度更低且推理速度更快。 The multiple fusion modules of deep fusion generative adversarial network(DF-GAN)were independent of each other,which leaded to a shallow fusion depth and made it difficult to obtain the optimal fusion result.Hence,a text-to-image synthesis algorithm which based on deep propagated fusion generative adversarial network(DPF-GAN)was proposed to solve these issues.This algorithm connected adjacent affine and fusion modules through concatenation,so that the previous fusion information can be propagated to the subsequent fusion modules.This facilitates a deeper integration of text and image.Through experimental results on the CUB-200-2011 dataset and COCO dataset,found that the quality of images which generated by DPF-GAN was better than DF-GAN.The FID score on CUB-200-2011 dataset was decreased by approximately 11.34%compared to DF-GAN.Compared to the Recurrent affine transformation generative adversarial network(RAT-GAN),DPF-GAN offers lower spatial complexity and faster inference speed.

作者吴海峰兰强 WU Haifeng;LAN Qiang(School of Computer and Information,Anqing Normal University,Anqing 246133,China)

机构地区安庆师范大学计算机与信息学院

出处《安庆师范大学学报（自然科学版）》 2024年第3期78-83,共6页 Journal of Anqing Normal University(Natural Science Edition)

基金安徽省自然科学基金(2108085MF216)。

关键词文本生成图像生成对抗网络仿射变换深度传播融合单级主干 text-to-image synthesis generative adversarial network affine transformation deeply propagated fusion single level backbone

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1薛志杭,许喆铭,郎丛妍,冯松鹤,王涛,李浥东.基于图像-文本语义一致性的文本生成图像方法[J].计算机研究与发展,2023,60(9):2180-2190. 被引量：5

共引文献4

1曹寅,秦俊平,马千里,孙昊,闫凯,王磊,任家琪.文本生成图像研究综述[J].浙江大学学报（工学版）,2024,58(2):219-238. 被引量：2
2曹寅,秦俊平,高彤,马千里,任家琪.基于生成对抗网络的文本两阶段生成高质量图像方法[J].浙江大学学报（工学版）,2024,58(4):674-683. 被引量：1
3张镭赋,高家骥.多模态图像局部极值点特征生成方法仿真[J].计算机仿真,2024,41(8):481-485.
4华丹玫.从“艺格敷词”到“以文生图”——生成式人工智能的法治因应[J].中国版权,2024(4):36-45.

1李赛.人类命运共同体理念在拉美地区的传播路径及优化[J].风采童装,2024(2):0031-0033.
2李辉.交互叙事视角下广州数字沉浸文旅创新发展策略研究[J].旅游与摄影,2024(14):37-39.
3应华.《红楼梦》十二金钗女性群像的IP设计的创新转化[J].齐齐哈尔大学学报（哲学社会科学版）,2024(10):124-127.
4马圆港,冯跃,林卓胜,李胜可,吴欣,刘启超,徐红.基于文献计量学和文本分析法的智能中医面诊分区方法系统性综述[J].世界科学技术-中医药现代化,2024,26(5):1132-1141.
5姚晓丽,赵静,李昕孜.基于生成式AI的北京灯彩非遗活化创新设计[J].工业设计,2024(10):108-112.
6陈稀瑶,赵鑫,谭赓.4G/5G低频网天馈建设综合解决方案研究[J].数字通信世界,2024(10):13-15.
7王远明,郑辉才,卓越,陈亮.三种血浆标志物与老年急性肺栓塞患者危险分层和预后不良的相关性研究[J].中华老年心脑血管病杂志,2024,26(10):1147-1151.
8刘宏哲,陶相如,徐成,曹东璞.一种优化多尺度特征融合的人体姿态估计方法[J].机械工程学报,2024,60(16):306-313.
9邵景晨,柴玉梅,王黎明.基于语义加权的双层LSTM图像描述生成方法研究[J].计算机应用与软件,2024,41(10):155-162.
10习怡萌,秦飞舟,李宏斌,刘立波.结合全局和局部特征的深度哈希细粒度图像检索[J].西北工程技术学报,2024,23(3):281-288.

安庆师范大学学报（自然科学版）

2024年第3期

浏览历史

内容加载中请稍等...

基于深度传播融合生成对抗网络的文本生成图像算法

参考文献1

共引文献4

相关作者

相关机构

相关主题

浏览历史