基于语义布局融合文本图像生成算法

Semantic Layout Aware Generative Adversarial Network

下载PDF

导出

摘要文本到图像生成方法旨在生成与文本描述在语义上一致的高质量图像。先前生成对抗性网络通常首先生成具有粗略形状和颜色的初始图像,然后将初始图像细化为高分辨率图像。大多数堆叠式体系结构仍然存在两个主要问题:(1)这些方法在很大程度上取决于初始图像的质量。如果初始图像没有很好地初始化,那么最终合成的图像看起来像是来自不同图像尺度的视觉特征的简单组合。(2)以往工作广泛采用的跨模态文本图像融合方法在文本图像融合过程中受到限制。提出了一种新的文本到图像生成模型,该模型引入了一个无需多生成器即可直接生成高质量图像的单阶段主干,以及一个新的语义布局深度融合网络,以实现文本和视觉特征的充分融合。在具有挑战性的CUB和COCO Stuff数据集上的实验证明了模型在生成图像方面的能力,包括视觉逼真度和与输入文本描述的一致性。

作者黄结余郑炳辉

机构地区上海大学上海电影学院

出处《工业控制计算机》 2024年第1期139-140,共2页 Industrial Control Computer

关键词文本生成图像生成对抗网络特征融合

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1顾军华,崔彭滔,徐雯佳.基于特征引导的遥感图像显著性目标检测[J].现代计算机,2023,29(20):9-15.
2张剑.高等级直升机模拟器体系化设计[J].中国科技信息,2024(3):56-59.
3黎瑞泉,翁彬,陈家祯,黄添强,游立军.一种气温降尺度的半循环对抗生成网络[J].福建师范大学学报（自然科学版）,2024,40(1):87-95. 被引量：1
4何卓豪,宋甫元,陆越.基于多尺度特征融合的图像压缩感知重构[J].软件导刊,2024,23(1):156-160.
5王军,高放,省海先,张宇.基于Swin Transformer生成对抗网络的图像生成算法[J].小型微型计算机系统,2024,45(1):241-248. 被引量：3
6丁美荣,赖锦钱,曾碧卿,徐马一,陈炳志.基于局部全局上下文引导的方面级情感分析[J].软件导刊,2024,23(1):190-196.
7安森美推超低功耗图像传感器,图像质量大幅提升[J].世界电子元器件,2023(12):21-23.
8赵强,王中卿,王红玲.融合多模态信息的产品摘要抽取模型[J].计算机应用,2024,44(1):73-78.
9唐丛,刘宗明.食品包装视觉信息传达[J].食品与机械,2023,39(12):92-99.
10吴含欣,董树锋,张祥龙,南斌,刘颖,南君培.考虑碳交易机制的含风电电力系统日前优化调度[J].电网技术,2024,48(1):70-78. 被引量：3

工业控制计算机

2024年第1期

浏览历史

内容加载中请稍等...

基于语义布局融合文本图像生成算法

相关作者

相关机构

相关主题

浏览历史