期刊文献+
共找到510篇文章
< 1 2 26 >
每页显示 20 50 100
基于知识图谱的冬奥赛事气象服务文本生成方法研究
1
作者 丰德恩 张雪英 +4 位作者 唐卫 王益鹏 王慕华 渠寒花 李敏 《科学技术与工程》 北大核心 2024年第16期6600-6609,共10页
气象服务文本是为赛事顺利举行及赛事期间的各项活动提供必要的气象保障,是组委会、裁判、各代表队的工作人员获取气象信息开展相关工作的载体。现有气象文本生产需要人工编写审核,效率不高。相比之下,全自动文本生成更加依赖于模板和... 气象服务文本是为赛事顺利举行及赛事期间的各项活动提供必要的气象保障,是组委会、裁判、各代表队的工作人员获取气象信息开展相关工作的载体。现有气象文本生产需要人工编写审核,效率不高。相比之下,全自动文本生成更加依赖于模板和固定的形式。针对以上问题,结合自然语言处理技术提出基于知识图谱的冬奥赛事气象服务文本生成方法。重点从历史赛事气象服务文本中进行内容分析和特征提取,利用气象数据和历史赛事信息构建高山滑雪赛事知识图谱。该方法根据实时气象数据和文稿模板生成天气描述文本,然后基于知识图谱查询推理技术得到赛事影响结果并生成相应文本。实验结果表明:气象服务文本的自动生成结果具有较好的准确性和可读性,有助于冬奥赛事的顺利推进,该文本生成方法面向特定领域也具有较好的应用前景。 展开更多
关键词 知识图谱 文本生成 气象服务 冬奥赛事 知识推理
下载PDF
可控文本生成技术研究综述
2
作者 王舰 孙宇清 《中文信息学报》 CSCD 北大核心 2024年第10期1-23,共23页
可控文本生成任务是指生成符合语法规则和语义需求,且满足给定约束的自然语言文本,具有重要应用价值。如何将约束嵌入到隐空间,从而有效控制离散的词汇生成过程是十分困难的,特别是在复杂应用场景中:不仅需要控制文本内容,还要求生成的... 可控文本生成任务是指生成符合语法规则和语义需求,且满足给定约束的自然语言文本,具有重要应用价值。如何将约束嵌入到隐空间,从而有效控制离散的词汇生成过程是十分困难的,特别是在复杂应用场景中:不仅需要控制文本内容,还要求生成的长文本形式多样、语言灵活以及逻辑合理等,这使得可控文本生成任务更具挑战性且难以评估。近年来,数据驱动的神经方法得到了广泛应用,特别是大规模预训练语言模型大幅度提升了生成文本质量。该文综述这些生成方法中的代表性技术架构和模型,讨论文本生成领域定性和定量评价指标,以及相关数据集;针对可控文本生成任务的文本多样性和句子间语义一致性等高层次需求,重点讨论相关技术前沿进展,分析其理论依据和技术优势;最后总结可控文本生成任务仍然面临的挑战和未来发展方向。 展开更多
关键词 可控文本生成 文本评估 文本多样性 文本生成
下载PDF
基于内在质量约束的文本生成和评价综述 被引量:1
3
作者 兰玉乾 饶元 +3 位作者 李冠呈 孙菱 夏昺灿 辛婷婷 《电子学报》 EI CAS CSCD 北大核心 2024年第2期633-659,共27页
近年来,以ChatGPT为代表的能够适应复杂场景、并能满足人类的各种应用需求为目标的文本生成算法模型成为学术界与产业界共同关注的焦点.然而,ChatGPT等大规模语言模型(Large Language Model,LLM)高度忠实于用户意图的优势隐含了部分的... 近年来,以ChatGPT为代表的能够适应复杂场景、并能满足人类的各种应用需求为目标的文本生成算法模型成为学术界与产业界共同关注的焦点.然而,ChatGPT等大规模语言模型(Large Language Model,LLM)高度忠实于用户意图的优势隐含了部分的事实性错误,而且也需要依靠提示内容来控制细致的生成质量和领域适应性,因此,研究以内在质量约束为核心的文本生成方法仍具有重要意义.本文在近年来关键的内容生成模型和技术对比研究的基础上,定义了基于内在质量约束的文本生成的基本形式,以及基于“信、达、雅”的6种质量特征;针对这6种质量特征,分析并总结了生成器模型的设计和相关算法;同时,围绕不同的内在质量特征总结了多种自动评价和人工评价指标与方法.最后,本文对文本内在质量约束技术的未来研究方向进行了展望. 展开更多
关键词 自然语言处理 语言模型 文本生成 文本质量 文本评价
下载PDF
结合语义分割图的注意力机制文本生成图像
4
作者 梁成名 李云红 +3 位作者 李丽敏 苏雪平 朱绵云 朱耀麟 《空军工程大学学报》 CSCD 北大核心 2024年第4期118-127,共10页
针对生成对抗网络生成图像存在结构不完整、内容不真实、质量差的问题,提出一种结合语义分割图的注意力机制文本到图像生成模型(SSA-GAN)。首先采用一种简单有效的深度融合模块,以全局句子向量作为输入条件,在生成图像的同时,充分融合... 针对生成对抗网络生成图像存在结构不完整、内容不真实、质量差的问题,提出一种结合语义分割图的注意力机制文本到图像生成模型(SSA-GAN)。首先采用一种简单有效的深度融合模块,以全局句子向量作为输入条件,在生成图像的同时,充分融合文本信息。其次结合语义分割图像,提取其边缘轮廓特征,为模型提供额外的生成和约束条件。然后采用注意力机制为模型提供细粒度词级信息,丰富所生成图像的细节。最后使用多模态相似度计算模型计算细粒度的图像-文本匹配损失,更好地训练生成器。通过CUB-200和Oxford-102 Flowers数据集测试并验证模型,结果表明:所提模型(SSA-GAN)与StackGAN、AttnGAN、DF-GAN以及RAT-GAN等模型最终生成的图像质量相比,IS指标值最高分别提升了13.7%和43.2%,FID指标值最高分别降低了34.7%和74.9%,且具有更好的可视化效果,证明了所提方法的有效性。 展开更多
关键词 文本生成图像 语义分割图像 生成对抗网络 注意力机制 仿射变换
下载PDF
文本生成图像研究综述 被引量:2
5
作者 曹寅 秦俊平 +4 位作者 马千里 孙昊 闫凯 王磊 任家琪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第2期219-238,共20页
对文本生成图像任务进行综合评估和整理,根据生成图像的理念,将文本生成图像任务分为3大类:基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像.针对基于生成对抗网络架构的文本生成图像方法,按照改... 对文本生成图像任务进行综合评估和整理,根据生成图像的理念,将文本生成图像任务分为3大类:基于生成对抗网络架构生成图像、基于自回归模型架构生成图像、基于扩散模型架构生成图像.针对基于生成对抗网络架构的文本生成图像方法,按照改进的不同技术点归纳为6小类:采用多层次体系嵌套架构、注意力机制的应用、应用孪生网络、采用循环一致方法、深度融合文本特征和改进无条件模型.通过对不同方法的分析,总结并讨论了现有的文本生成图像方法通用评估指标和数据集. 展开更多
关键词 人工智能生成内容 文本生成图像 生成对抗网络 自回归模型 扩散模型
下载PDF
基于预训练模型的受控文本生成研究综述 被引量:1
6
作者 周强伟 施水才 王洪俊 《软件导刊》 2024年第4期199-207,共9页
自然语言生成(NLG)作为人工智能的一个分支,近年来随着预训练语言模型(PLMs)的发展取得了显著进展。NLG旨在根据多种输入源(如文本、图像、表格和知识库)生成连贯、有意义的文本。研究者通过架构扩展、微调和提示学习等方法提升了PLMs... 自然语言生成(NLG)作为人工智能的一个分支,近年来随着预训练语言模型(PLMs)的发展取得了显著进展。NLG旨在根据多种输入源(如文本、图像、表格和知识库)生成连贯、有意义的文本。研究者通过架构扩展、微调和提示学习等方法提升了PLMs的性能。然而,NLG在处理非结构化输入和低资源语言生成方面仍面临挑战,尤其是在缺乏足够训练数据的环境中。为探讨NLG的最新发展、应用前景以及所面临的挑战,通过文献分析,提出PLMs性能改进策略,并展望未来研究方向。研究表明,尽管存在诸多限制,但NLG在内容创作、自动新闻报导、对话系统等领域已展现出潜力。随着技术的不断进步,NLG在自然语言处理和人工智能领域将扮演更重要的角色。 展开更多
关键词 人工智能 自然语言生成 受控文本生成 预训练语言模型 提示学习
下载PDF
基于外部知识筛选的主题文本生成技术研究 被引量:1
7
作者 王沛 杨频 +2 位作者 程芃森 代金鞘 贾鹏 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期69-77,共9页
在自然语言生成任务中,主题文本生成是一项富有挑战性的工作,其主要难点在于:源信息量远小于目标生成的信息量.为了解决该问题,本文提出一个基于外部知识筛选的主题文本生成模型Trans-K,通过引入与主题词相关的外部知识来丰富源信息,进... 在自然语言生成任务中,主题文本生成是一项富有挑战性的工作,其主要难点在于:源信息量远小于目标生成的信息量.为了解决该问题,本文提出一个基于外部知识筛选的主题文本生成模型Trans-K,通过引入与主题词相关的外部知识来丰富源信息,进而提高生成文本的质量.本文为了解决引入外部知识的“一词多义”问题,提出一种基于线性变换的主题向量计算方法,用于筛选和主题词语义一致的外部知识;提出一种基于注意力机制的外部权重计算方法,为每个外部词设定一个主题权重,使其更贴合文本语义;为了解决主题词(含候选词)在生成文本中反复出现的问题,提出一种基于多头注意力机制的内部权重计算方法.在EASSY数据集上的实验表明,与基线相比,Trans-K生成文本质量的各项指标更优.此外,人类评估表明,该模型可生成与主题更相关、语言更连贯、且符合语义逻辑的文本. 展开更多
关键词 自然语言生成 主题文本生成 TRANSFORMER HOWNET 知识增强
下载PDF
基于扩散序列的多元可控文本生成
8
作者 李晨阳 张龙 +1 位作者 郑秋生 钱少华 《计算机应用》 CSCD 北大核心 2024年第8期2414-2420,共7页
随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义... 随着大规模预训练语言模型的出现,文本生成技术已取得突破性进展。然而,在开放性文本生成领域,生成的内容缺乏拟人化的情感特征,使生成的文本难以让人产生共鸣和情感上的联系,可控文本生成在弥补当前文本生成技术不足方面具有重要意义。首先,在ChnSentiCorp数据集的基础上完成主题和情感属性的扩展,同时,为构建一个可生成流畅文本且情感丰富的多元可控文本生成模型,提出一种基于扩散序列的可控文本生成模型DiffuSeq-PT。该模型以扩散模型为基础架构,利用主题情感属性和文本数据在无分类器引导条件下对序列执行扩散过程,使用预训练模型ERNIE 3.0(Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation)的编码解码能力贴合扩散模型的加噪去噪过程,最终生成符合相关主题和多情感粒度的目标文本。与基准模型DiffuSeq相比,所提模型在2个公开的真实数据集(ChnSentiCorp和辩论数据集)上分别取得0.13和0.01的BERTScore值的提升,困惑度分别下降了14.318和9.46。 展开更多
关键词 扩散模型 序列扩散 预训练模型 提示 文本生成 可控生成 细粒度情感
下载PDF
基于明初医籍征引朱丹溪医论考察丹溪学派早期文本生成史
9
作者 徐晓聪 郑洪 《浙江中医药大学学报》 CAS 2024年第9期1116-1125,共10页
[目的]考察丹溪学派早期文本的生成过程。[方法]明初楼英《医学纲目》、刘纯《玉机微义》等医著中,多有引用丹溪医论。将此部分医论与丹溪著作相比对,辨明异同。并运用“文本生成论”的文学研究方法,分析丹溪著作与明初医籍征引的丹溪... [目的]考察丹溪学派早期文本的生成过程。[方法]明初楼英《医学纲目》、刘纯《玉机微义》等医著中,多有引用丹溪医论。将此部分医论与丹溪著作相比对,辨明异同。并运用“文本生成论”的文学研究方法,分析丹溪著作与明初医籍征引的丹溪医论存在差异的原因,论证丹溪通过“改定”自己的“稿本”,确立为“定本”的可能过程。再考察文本的物质载体与流传途径对文本生成的影响。[结果]《医学纲目》《玉机微义》等明初医籍征引的丹溪医论,与丹溪著作互校,可发现前者存在佚文与异文,显示当时有多种形态的丹溪医学文本流传。“佚文”或为弟子所记丹溪授徒语录,“异文”则是丹溪医论的“草稿”状态。丹溪现存著作或正是由“草稿”经过文本改定所形成的“定稿”。医籍的刊刻与传播也使得丹溪学派相关文本在元末明初基本定型。[结论]丹溪学派早期文本的生成,经历了一个动态且复杂的过程。考察丹溪学派的建构过程、丹溪医学思想的衍变,都应考虑这种文献与文本层面的变动。 展开更多
关键词 明初 《医学纲目》 《玉机微义》 朱丹溪 丹溪学派 文本生成
下载PDF
引入位置编码机制对抗网络的文本生成模型
10
作者 贺妮 牟莉 万晓慧 《计算机技术与发展》 2024年第9期154-158,共5页
针对目前对抗网络文本生成模型在生成文本时,出现词与词之间位置关系紊乱导致文本逻辑不通的问题,该文提出了一种引入位置编码机制对抗网络的文本生成模型(Position-Encoding GAN,PE_GAN)并进行探讨和验证。在对抗神经网络模型的基础上... 针对目前对抗网络文本生成模型在生成文本时,出现词与词之间位置关系紊乱导致文本逻辑不通的问题,该文提出了一种引入位置编码机制对抗网络的文本生成模型(Position-Encoding GAN,PE_GAN)并进行探讨和验证。在对抗神经网络模型的基础上引入位置编码机制,可以通过带有位置编码的词向量来标记文本中词与词之间的位置关系,生成器和判别器使用GRU神经网络的门控机制来减少梯度消失,同时利用蒙特卡洛策略思想来降低数据过拟合风险并提高生成文本的准确性。为了验证PE_GAN模型的有效性,使用开源数据和网络爬取的小说和新闻文本共同作为实验的数据集,结果表明:该模型中生成器和判别器loss值的差距比对比模型小,表明生成的文本更加接近真实文本;与Gumbel-softmax GAN模型、seq-GAN模型和LFMGAN模型相比,PE_GAN模型的BLEU-2、BLEU-3和BLEU-4的值分别都有明显的提高,表明引入位置编码机制后可以改善生成文本的逻辑性,由此可知该模型有较好的应用性。 展开更多
关键词 生成对抗神经网络 位置编码 文本生成 GRU神经网络 蒙特卡洛策略
下载PDF
大语言模型在社交媒体文本生成领域的应用研究——以小红书平台为例
11
作者 马君锡 王小刚 《新媒体研究》 2024年第6期16-20,共5页
基于大语言模型提示工程,探索生成具有社交媒体特色文本的应用方法。以小红书平台为例,在不对模型进行任何微调的前提下,设计提示模板并结合小样本学习,引导大语言模型生成符合小红书特色的文本内容。研究发现,将提示与小样本示例结合,... 基于大语言模型提示工程,探索生成具有社交媒体特色文本的应用方法。以小红书平台为例,在不对模型进行任何微调的前提下,设计提示模板并结合小样本学习,引导大语言模型生成符合小红书特色的文本内容。研究发现,将提示与小样本示例结合,能够显著提高生成文本的质量和相关性,同时保持文本内容的多样性和创新性。 展开更多
关键词 大语言模型 提示工程 社交媒体 文本生成 小红书
下载PDF
文本生成图像技术在视觉设计中的应用研究
12
作者 汪睿 《池州学院学报》 2024年第4期114-117,共4页
文本生成图像技术可以通过文本输入生成目标图像,具有生成方式简单、生成速度快、图像输出精良的特点。本文将视觉设计实践与文本生成图像技术相结合进行跨学科研究,选用文本生成图像工具进行视觉图像生成,通过建立生成图像质量评价指... 文本生成图像技术可以通过文本输入生成目标图像,具有生成方式简单、生成速度快、图像输出精良的特点。本文将视觉设计实践与文本生成图像技术相结合进行跨学科研究,选用文本生成图像工具进行视觉图像生成,通过建立生成图像质量评价指标体系对图像生成效果进行实证检验,进而探究文本生成图像技术在设计实践中的应用成效。研究成果可以为视觉设计创作实践通过应用文本生成图像技术优化设计流程,提高出图效率,拓展创意思维提供可行性思路。 展开更多
关键词 视觉设计 设计实践 文本生成图像 实证研究
下载PDF
基于自监督注意和图像特征融合的文本生成图像方法
13
作者 廖涌卉 张海涛 金海波 《液晶与显示》 CAS CSCD 北大核心 2024年第2期180-191,共12页
现有的层级式文本生成图像的方法在初始图像生成阶段仅使用上采样进行特征提取,上采样过程本质是卷积运算,卷积运算的局限性会造成全局信息被忽略并且远程语义无法交互。虽然已经有方法在模型中加入自注意力机制,但依然存在图像细节缺... 现有的层级式文本生成图像的方法在初始图像生成阶段仅使用上采样进行特征提取,上采样过程本质是卷积运算,卷积运算的局限性会造成全局信息被忽略并且远程语义无法交互。虽然已经有方法在模型中加入自注意力机制,但依然存在图像细节缺失、图像结构性错误等问题。针对上述存在的问题,提出一种基于自监督注意和图像特征融合的生成对抗网络模型SAF-GAN。将基于ContNet的自监督模块加入到初始特征生成阶段,利用注意机制进行图像特征之间的自主映射学习,通过特征的上下文关系引导动态注意矩阵,实现上下文挖掘和自注意学习的高度结合,提高低分辨率图像特征的生成效果,后续通过不同阶段网络的交替训练实现高分辨率图像的细化生成。同时加入了特征融合增强模块,通过将模型上一阶段的低分辨率特征与当前阶段的特征进行融合,生成网络可以充分利用低层特征的高语义信息和高层特征的高分辨率信息,更加保证了不同分辨率特征图的语义一致性,从而实现高分辨率的逼真的图像生成。实验结果表明,相较于基准模型(AttnGAN),SAF-GAN模型在IS和FID指标上均有改善,在CUB数据集上的IS分数提升了0.31,FID指标降低了3.45;在COCO数据集上的IS分数提升了2.68,FID指标降低了5.18。SAF-GAN模型能够有效生成更加真实的图像,证明了该方法的有效性。 展开更多
关键词 计算机视觉 生成对抗网络 文本生成图像 CotNet 图像特征融合
下载PDF
融合XLnet与DMGAN的文本生成图像方法
14
作者 赵泽纬 车进 吕文涵 《液晶与显示》 CAS CSCD 北大核心 2024年第2期168-179,共12页
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能... 针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。 展开更多
关键词 文本生成图像 XLnet模型 生成对抗网络 通道注意力
下载PDF
人工智能在中职英语教学中的应用——基于Chat GPT的文本生成应用技术
15
作者 刘舒 《太原城市职业技术学院学报》 2024年第8期120-122,共3页
随着科技的飞速发展,人工智能技术已逐渐渗透到各行各业中,教育领域也不例外。中职英语教学作为职业教育的重要组成部分,其教学质量和效果对于学生的职业发展具有重要意义。而人工智能技术的引入,为中职英语教学带来了新的机遇和挑战。... 随着科技的飞速发展,人工智能技术已逐渐渗透到各行各业中,教育领域也不例外。中职英语教学作为职业教育的重要组成部分,其教学质量和效果对于学生的职业发展具有重要意义。而人工智能技术的引入,为中职英语教学带来了新的机遇和挑战。文章将重点探讨基于教学实践,Chat GPT的文本生成应用技术在中职英语教学中的应用。 展开更多
关键词 人工智能 chat GTP 文本生成 中职英语
下载PDF
端方档案的文本生成与利用
16
作者 张建斌 《北方论丛》 2024年第3期119-128,共10页
档案作为史料的一种载体,往往被视为第一手材料,但其文本形成过程往往并非研究者关注重点,实则与历史研究联系紧密。中国第一历史档案馆藏端方档案,记录晚清地方督抚端方为官期间的往来电报、信函及各类杂档,体量很大,内容涉及重要史事... 档案作为史料的一种载体,往往被视为第一手材料,但其文本形成过程往往并非研究者关注重点,实则与历史研究联系紧密。中国第一历史档案馆藏端方档案,记录晚清地方督抚端方为官期间的往来电报、信函及各类杂档,体量很大,内容涉及重要史事,具有较高的史料价值,为学界所重视。端方档案尽可能地保持了文本生成以来的本来面貌,具有原始性、整体性、系统性的特点。考察端方档案的文本的生成、流传以及整理形成轨迹,可以看到每一份档案均具有其衍生过程。档案的形成历程影响其作为史料的利用以及研究者对于历史的认知。 展开更多
关键词 端方档案 文本生成 流传整理 史料批判
下载PDF
以《冷斋夜话》为例看宋代诗话的文本生成机制
17
作者 周萌 《阴山学刊》 2024年第3期41-47,共7页
诗话是古典诗学的主流形式之一,却常被今人批评缺乏逻辑性,这种误解是忽视诗话逻辑表达特殊性的结果。以《冷斋夜话》为例,从话题的选择与编排、受众的预设与引导、热点的争议性阐释、群体的助推性互动等多重角度来看,宋代诗话虽非按照... 诗话是古典诗学的主流形式之一,却常被今人批评缺乏逻辑性,这种误解是忽视诗话逻辑表达特殊性的结果。以《冷斋夜话》为例,从话题的选择与编排、受众的预设与引导、热点的争议性阐释、群体的助推性互动等多重角度来看,宋代诗话虽非按照概念逻辑组织成篇,但传播逻辑清晰可见,并对诗学理念与方法的呈现有决定性影响。正因如此,厘清文本生成机制,对于深入了解宋代诗话的内在理路,更合理地与国外诗学比照得失,均有启发意义。 展开更多
关键词 惠洪 《冷斋夜话》 宋代诗话 文本生成机制
下载PDF
融合知识库与语境信息的档案文本生成式问答模型构建研究
18
作者 赵莹莹 《山西档案》 北大核心 2024年第1期132-134,共3页
针对新时代档案智能化发展需求,提出一种融合知识库与语境信息的档案文本生成式问答新范式。在此范式下,围绕模型架构设计、语境信息建模、知识库构建、异构信息融合等方面展开系统性探索,形成了“知识库驱动、语境信息增强”的档案智... 针对新时代档案智能化发展需求,提出一种融合知识库与语境信息的档案文本生成式问答新范式。在此范式下,围绕模型架构设计、语境信息建模、知识库构建、异构信息融合等方面展开系统性探索,形成了“知识库驱动、语境信息增强”的档案智能问答技术体系。在理论与技术层面,为档案知识服务智能化升级提供新思路,对于推动人工智能与档案管理的融合发展具有重要价值,能加快构建智能化的新时代档案知识服务新体系。 展开更多
关键词 档案文本生成式问答 知识库 上下文学习 语义融合 智能档案
下载PDF
文本生成人脸:基于BERT-DCGAN的文本人脸生成
19
作者 余松森 陈新 苏海 《计算机与数字工程》 2024年第3期909-914,共6页
随着生成对抗网络(GANs)的提出,从文本中自动合成逼真的图像的技术已经初步实现。然而,现有的大多数任务仅限于从标注(captions)中生成简单的图像,如画、鸟。作为文本生成图像(T2I)的子领域,文本生成人脸图像(T2F)在公共安全领域有着巨... 随着生成对抗网络(GANs)的提出,从文本中自动合成逼真的图像的技术已经初步实现。然而,现有的大多数任务仅限于从标注(captions)中生成简单的图像,如画、鸟。作为文本生成图像(T2I)的子领域,文本生成人脸图像(T2F)在公共安全领域有着巨大的应用潜力,如犯罪嫌疑人人脸重建。但是由于当前的任务数据集要么非常小,要么不包括标注,缺少可用相关的数据集,几乎没有对这个领域有相关的研究。论文通过Text2FaceGAN中所提出的算法将CelebA数据集的属性列表转换为一组标注,并对CelebA数据集中的人脸图像进行切割,生成<标注-人脸图像>的成对的数据集ImprovedCelebA,解决了数据集的不足。此外,由于文本生成人脸图像(T2F)的效果依赖于文本编码的质量,传统的T2I方法使用粗粒度的文本编码手段无法生成逼真的人脸图像,因此论文提出一种根据细粒度的人脸文本描述生成人脸的方法,并利用带有GAN-CLS损失的BERT-DCGAN来学习这一条件多模态问题。为了避免前期训练时出现传统GANs训练时出现梯度消失的问题,每4次训练对真假图像的标签进行了翻转。通过实验验证,与其他文本生成人脸图像方法相比,该算法不仅可以生成逼真的人脸图像,而且大大减少了训练时间。 展开更多
关键词 生成对抗网络 文本生成人脸 多模态
下载PDF
文本生成式绘画的创作主体性及创造力研究
20
作者 张笑娟 《艺术科技》 2024年第2期52-55,84,共5页
目的:人工智能相关技术的突飞猛进,大大推动了科技与艺术的交融。在绘画领域引入人工智能图像生成技术,是技术在艺术创作中的探索,是绘画界对人工智能的尝试,为绘画艺术带来了创新性和无限可能性。文本生成式高清图像与超乎想象的绘画... 目的:人工智能相关技术的突飞猛进,大大推动了科技与艺术的交融。在绘画领域引入人工智能图像生成技术,是技术在艺术创作中的探索,是绘画界对人工智能的尝试,为绘画艺术带来了创新性和无限可能性。文本生成式高清图像与超乎想象的绘画作品给人们带来了极大的视觉冲击,引发了人们对人工智能绘画在创作表现上的多维思考。如何理解文本生成式绘画的创作主体性及创造力,成为一个重要议题。方法:为深入探讨文本生成式绘画的创作主体性及创造力,文章通过梳理文本生成式人工智能绘画的创作过程,分别从人类与技术的角色、关系和作用入手,分析文本生成式绘画中的创作主体性及创造力问题,阐明文本生成式人工智能绘画创作主体性的动态变化关系,总结人类与人工智能模型在该创作中发挥创造力的衡量方式及具体途径,并引入人机协同艺术概念及特点,展望其未来。结果:通过分析,可以得知人类与技术在人工智能绘画创作中并无绝对主体性,二者的创作关系是动态变化的,创作地位视具体参与方式及程度而定,只能针对具体案例进行分析。结论:在艺术创作领域,人机协同是艺术创作未来发展的方向之一,人机协同艺术将有望引领人类迈入“全民艺术家”时代,实现艺术“民主化”。 展开更多
关键词 文本生成式绘画 人工智能 创作主体性 创造力 人机协同艺术
下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部