期刊文献+
共找到94,145篇文章
< 1 2 250 >
每页显示 20 50 100
如何引导学生解读文本
1
作者 旦正加 《语文世界(上旬刊)》 2024年第3期26-27,共2页
教师引导学生对文本进行探究,关键是要激发学生的文本探究意识。在小学语文教学中,教师要引导学生通过文本比较、文本对话、文本想象打开语文教材文本,激发学生的文本探究意识。文本中蕴藏着妙不可言的意蕴,文本探究能让学生获得生命的... 教师引导学生对文本进行探究,关键是要激发学生的文本探究意识。在小学语文教学中,教师要引导学生通过文本比较、文本对话、文本想象打开语文教材文本,激发学生的文本探究意识。文本中蕴藏着妙不可言的意蕴,文本探究能让学生获得生命的智慧。此外,教师要懂得探究不应只是理科学习的专利,学生的语文学习同样需要探究。探究能真正激发学生的阅读思维、想象,能促进学生对语文文本的感悟。 展开更多
关键词 文本对话 教材文本 语文文本 教师引导 文本探究 解读文本 文本比较 理科学习
下载PDF
基于词-主题-文本异质网络的短文本分类方法
2
作者 徐涛 赵星甲 卢敏 《计算机应用与软件》 北大核心 2024年第1期146-152,182,共8页
针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学... 针对现有分类方法未考虑长距离词的语义相关性和文本间潜在主题共享的问题,提出一种基于词-主题-文本异质网络(WTDHN)的短文本分类方法。通过Word2vec训练词的上下文语义向量;构建词相关性矩阵以充足的词共现信息增强短文本各级别语义学;构建以词、主题和文本为节点的异质网络,并采用图卷积学习节点之间的高阶邻域信息,丰富短文本语义。相较于基准分类模型,该方法在五个公开短文本数据集上的分类准确率平均提高1.56%。 展开更多
关键词 词-主题-文本异质网络 词共现 文本-主题分布 文本分类
下载PDF
中国古代艺术类著录的注文文本研究
3
作者 郭建平 《东南大学学报(哲学社会科学版)》 北大核心 2024年第2期117-123,148,共8页
以往的中国艺术史研究较为关注正文文本分析,而忽略其注文文本及其他文本(题跋文本、序跋文本等),至于几者之间意义共生而形成的“综合性文本”更鲜有学人涉及。值得注意的是,在中国古代艺术著录中,正文文本多因注文文本而开出新义,获... 以往的中国艺术史研究较为关注正文文本分析,而忽略其注文文本及其他文本(题跋文本、序跋文本等),至于几者之间意义共生而形成的“综合性文本”更鲜有学人涉及。值得注意的是,在中国古代艺术著录中,正文文本多因注文文本而开出新义,获得新解读,这不仅仅是因为注文文本作为正文文本的“衍生物”,其往往是正文文本内容的补充、修正与考释,还因为正文文本与多数产生于后代的注文文本分别处于不同的时空,处于不同的历史文化背景,而具有“衍生性”性质的注文文本在对正文文本进行勘正及强调某些重点时,新层次的文本内容形成,而这个新的文本所彰显出来的意义也许从未被正文文本原作者所意识到或清晰地表达出来,对此问题进行揭示可开拓艺术史研究思路。 展开更多
关键词 多重文本 注文文本 题跋文本 艺术史
下载PDF
基于深度学习的自然场景文本检测综述
4
作者 连哲 殷雁君 +1 位作者 云飞 智敏 《计算机工程》 CAS CSCD 北大核心 2024年第3期16-27,共12页
基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和... 基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。 展开更多
关键词 深度学习 计算机视觉 自然场景文本 文本检测 多方向文本检测 多尺度文本检测
下载PDF
基于内在质量约束的文本生成和评价综述
5
作者 兰玉乾 饶元 +3 位作者 李冠呈 孙菱 夏昺灿 辛婷婷 《电子学报》 EI CAS CSCD 北大核心 2024年第2期633-659,共27页
近年来,以ChatGPT为代表的能够适应复杂场景、并能满足人类的各种应用需求为目标的文本生成算法模型成为学术界与产业界共同关注的焦点.然而,ChatGPT等大规模语言模型(Large Language Model,LLM)高度忠实于用户意图的优势隐含了部分的... 近年来,以ChatGPT为代表的能够适应复杂场景、并能满足人类的各种应用需求为目标的文本生成算法模型成为学术界与产业界共同关注的焦点.然而,ChatGPT等大规模语言模型(Large Language Model,LLM)高度忠实于用户意图的优势隐含了部分的事实性错误,而且也需要依靠提示内容来控制细致的生成质量和领域适应性,因此,研究以内在质量约束为核心的文本生成方法仍具有重要意义.本文在近年来关键的内容生成模型和技术对比研究的基础上,定义了基于内在质量约束的文本生成的基本形式,以及基于“信、达、雅”的6种质量特征;针对这6种质量特征,分析并总结了生成器模型的设计和相关算法;同时,围绕不同的内在质量特征总结了多种自动评价和人工评价指标与方法.最后,本文对文本内在质量约束技术的未来研究方向进行了展望. 展开更多
关键词 自然语言处理 语言模型 文本生成 文本质量 文本评价
下载PDF
基于字词向量融合的民航智慧监管短文本分类
6
作者 王欣 干镞锐 +2 位作者 许雅玺 史珂 郑涛 《中国安全科学学报》 CAS CSCD 北大核心 2024年第2期37-44,共8页
为解决民航监管事项所产生的检查记录仅依靠人工进行分类分析导致效率低的问题,提出一种基于数据增强与字词向量融合的双通道特征提取的短文本分类模型,探讨民航监管事项的分类,包括与人、设备设施环境、制度程序和机构职责等相关问题... 为解决民航监管事项所产生的检查记录仅依靠人工进行分类分析导致效率低的问题,提出一种基于数据增强与字词向量融合的双通道特征提取的短文本分类模型,探讨民航监管事项的分类,包括与人、设备设施环境、制度程序和机构职责等相关问题。为解决类别不平衡问题,采用数据增强算法在原始文本上进行变换,生成新的样本,使各个类别的样本数量更加均衡。将字向量和词向量按字融合拼接,得到具有词特征信息的字向量。将字词融合的向量分别送入到文本卷积神经网络(TextCNN)和双向长短期记忆(BiLSTM)模型中进行不同维度的特征提取,从局部的角度和全局的角度分别提取特征,并在民航监管事项检查记录数据集上进行试验。结果表明:该模型准确率为0.9837,F 1值为0.9836。与一些字嵌入模型和词嵌入模型相对比,准确率提升0.4%。和一些常用的单通道模型相比,准确率提升3%,验证了双通道模型提取的特征具有全面性和有效性。 展开更多
关键词 字词向量融合 民航监管 文本 文本卷积神经网络(TextCNN) 双向长短期记忆(BiLSTM)
原文传递
基于CLIP模型和文本重建的人脸图像生成方法研究
7
作者 李源凡 张丽红 《测试技术学报》 2024年第2期154-160,共7页
针对文本生成人脸方法中生成图像与文本描述不一致、图像分辨率较低等问题,提出一种跨模态文本生成人脸图像网络框架。首先,采用CLIP预训练模型对文本进行特征提取,通过条件增强模块增强文本语义特征并生成隐藏向量;然后,将隐藏向量通... 针对文本生成人脸方法中生成图像与文本描述不一致、图像分辨率较低等问题,提出一种跨模态文本生成人脸图像网络框架。首先,采用CLIP预训练模型对文本进行特征提取,通过条件增强模块增强文本语义特征并生成隐藏向量;然后,将隐藏向量通过映射网络投影到预训练模型StyleGAN的隐式空间中获得解纠缠隐藏向量,将该向量输入到StyleGAN生成器中生成高分辨率人脸图像;最后,采用文本重建模块将人脸图像重新生成文本,计算重建文本和输入文本之间的语义对齐损失,并将其作为语义监督指导网络训练。在Multi-Modal CelebA-HQ和CelebAText-HQ两个数据集上进行训练与测试,实验结果表明,相比其他方法,该方法能生成更加符合文本描述的高分辨率人脸图像。 展开更多
关键词 文本生成人脸 跨模态 CLIP预训练 文本重建 文本映射
下载PDF
基于融合矩阵的文本相似度计算实现检索结果聚类
8
作者 赵悦阳 崔雷 《医学信息学杂志》 CAS 2024年第3期58-64,共7页
目的/意义弥补医学文本语义表示方面的不足,实现PubMed数据库检索结果聚类。方法/过程采用Jaccard系数和TF-IDF构建融合矩阵方法,建立短语间、文档间、短语与文档内容间的相似性关系融合矩阵,训练聚类算法,将PubMed数据库检索结果集合分... 目的/意义弥补医学文本语义表示方面的不足,实现PubMed数据库检索结果聚类。方法/过程采用Jaccard系数和TF-IDF构建融合矩阵方法,建立短语间、文档间、短语与文档内容间的相似性关系融合矩阵,训练聚类算法,将PubMed数据库检索结果集合分组,随后生成类别标签,描述每一类簇文档的含义。结果/结论基于融合矩阵的聚类效果较好,提取出描述类别的高频词能很好地区分类别含义,对检索结果文本聚类任务有效。 展开更多
关键词 文献检索 文本聚类 融合矩阵 文本相似度
下载PDF
基于深度学习的变电设备铭牌文本提取算法
9
作者 卫良润 杨柳林 《物联网技术》 2024年第1期37-41,共5页
变电设备铭牌数据管理对电力系统运行至关重要。在巡检设备中使用图像文本提取技术可以提高铭牌信息采集效率。然而,变电设备铭牌图像中存在多种文本提取难点,如文本多样性、背景多样性、图片质量多样性、形变多样性和排版多样性等。本... 变电设备铭牌数据管理对电力系统运行至关重要。在巡检设备中使用图像文本提取技术可以提高铭牌信息采集效率。然而,变电设备铭牌图像中存在多种文本提取难点,如文本多样性、背景多样性、图片质量多样性、形变多样性和排版多样性等。本文提出了一种端到端的图像文本提取算法,使用RoIRotate模块将文本检测和文本识别合并为一个任务。此外,本文为中文场景设计了一套训练流程并创建了端到端标注的变电设备铭牌文本数据集(RSEN)。实验结果表明,本文使用方法在该领域的文本检测精度达到88.89%,查全率为87.67%,文本识别精度为90.68%。这表明本文提出的文本提取方法具有鲁棒性,同时也验证了本文提出的数据集和训练方法的可靠性和有效性。 展开更多
关键词 变电设备 铭牌 深度学习 文本提取 文本检测 文本识别
下载PDF
基于注意力机制和CNN的多标签文本分类模型
10
作者 杨春霞 吴佳君 +1 位作者 瞿涛 姚思诚 《计算机应用与软件》 北大核心 2024年第3期156-162,共7页
针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与... 针对目前多标签文本分类模型存在无法充分提取文本语义与标签的相互关系,提出一种基于注意力机制和卷积神经网络(CNN)的多标签文本分类模型。通过多头注意力机制和CNN对文本进行建模表示,充分挖掘文本全局和局部的语义特征;结合标签与文本信息进行交互注意力计算,捕捉结合文本内容后标签间的相互关系;使用一种自适应融合策略进一步提取两者语义信息。实验结果表明,该模型相比于其他主流模型能有效提升多标签文本分类效果。 展开更多
关键词 多标签文本分类 注意力机制 卷积神经网络 文本表示
下载PDF
基于网络文本分析的智慧酒店服务质量研究——以浙江杭州F酒店为例
11
作者 李文莲 郭欣 殷振华 《商展经济》 2024年第5期121-124,共4页
消费者对智慧酒店服务质量的评价存在与传统酒店不同的要素与关注点。本文以飞猪网站上对F酒店的804条评论为依据,用ROST ContentMining6软件对评论进行文本分析,研究消费者对F酒店服务质量的评价,并在此基础上建立消费者对智慧酒店服... 消费者对智慧酒店服务质量的评价存在与传统酒店不同的要素与关注点。本文以飞猪网站上对F酒店的804条评论为依据,用ROST ContentMining6软件对评论进行文本分析,研究消费者对F酒店服务质量的评价,并在此基础上建立消费者对智慧酒店服务质量评价的指标体系,包括有形性、可靠性、响应性、保证性、移情性和人机交互性。结果表明,消费者对智慧设施的现代和科技感、人机交互体验的关注度最高;对F酒店的整体满意度较高,积极情绪占比高达75.35%;但对各项指标的评价存在差异,其中对响应性满意度最高,人机交互满意度次之,对移情性满意度最低,对有形性、可靠性和保证性的满意度居中。针对这些问题,本文在创新设施、管理策略与人员服务方面提出改进策略,以供参考。 展开更多
关键词 智慧酒店 F酒店 文本分析法 服务质量 网络文本 人员管理策略
下载PDF
文学视域中解读ChatGPT文本
12
作者 张渊 《湖北经济学院学报(人文社会科学版)》 2024年第1期111-114,共4页
ChatGPT是OpenAI实验室研发的一款聊天机器人,一经推出就受到各界关注,不过关注焦点大多集中在计算机技术变革和信息技术影响力等方面,从文学视域关照较少。本文以为应将目光聚焦在文学创作和文学鉴赏领域,跳出技术利弊探究的内部低效... ChatGPT是OpenAI实验室研发的一款聊天机器人,一经推出就受到各界关注,不过关注焦点大多集中在计算机技术变革和信息技术影响力等方面,从文学视域关照较少。本文以为应将目光聚焦在文学创作和文学鉴赏领域,跳出技术利弊探究的内部低效漩涡中,尽可能探索有关的可能性,让所有的思辨和研判都建立在外部边界的确定,而非已有已探明的物质内核中去。本文试图以ChatGPT文本生成过程中显示出的独特性,放在创作活动的总体把握下,探究出其中值得深挖和思考的新内容新意义。文本的准确定位,使得鉴赏者能够明确该以何种标准和角度来鉴赏文本的独特韵味,在创作者和阅读者的双重加持下,ChatGPT生成文本更值得被关注和认可。 展开更多
关键词 ChatGPT 文本 文学创作 文本定位 文本鉴赏
下载PDF
基于文本类型的法律文本翻译策略
13
作者 陈娟娟 《英语广场(学术研究)》 2024年第13期40-43,共4页
法律在人们日常生活中起着举足轻重的作用。在经济全球化的影响下,各国相互依赖程度日益加深,相互遵守法律规范已成为跨际交流的重要组成部分,因此法律翻译也变得不可或缺。然而,由于法律文本的特殊性,法律文本的翻译策略也不同于其他... 法律在人们日常生活中起着举足轻重的作用。在经济全球化的影响下,各国相互依赖程度日益加深,相互遵守法律规范已成为跨际交流的重要组成部分,因此法律翻译也变得不可或缺。然而,由于法律文本的特殊性,法律文本的翻译策略也不同于其他文本。本文从文本类型视角出发,分析法律文本特点,探究法律文本的翻译策略,旨在为法律文本翻译提供启示和借鉴。 展开更多
关键词 文本类型 法律文本 文本特点 翻译策略
下载PDF
浅谈互文性视野下文学文本的电视剧改编
14
作者 徐华 《上海广播电视研究》 2024年第1期81-89,共9页
文本是意义丰富的表达。优秀的文学作品为电视剧改编开辟了新鲜多元的再创作空间。本文从互文性理论出发,探讨文学文本的电视剧改编。文学改编借用互文手法实现与原著文本以及历史、现实之间的多重观照,提升文本的价值。从互文性视野考... 文本是意义丰富的表达。优秀的文学作品为电视剧改编开辟了新鲜多元的再创作空间。本文从互文性理论出发,探讨文学文本的电视剧改编。文学改编借用互文手法实现与原著文本以及历史、现实之间的多重观照,提升文本的价值。从互文性视野考察文本改编就要在关注原文本的同时,更要关注文本的产生所赖以建立的客观存在的历史和现实的其他文本材料基础。这样,才能突破原著的藩篱,创造出具有时代意义的经典之作。 展开更多
关键词 创作空间 互文性 文学文本 文学作品 历史和现实 互文手法 关注文本 文本改编
下载PDF
基于关键实体和文本摘要多特征融合的话题匹配算法
15
作者 纪科 张秀 +3 位作者 马坤 孙润元 陈贞翔 邬俊 《郑州大学学报(工学版)》 CAS 北大核心 2024年第2期51-59,共9页
随着网络的快速普及,互联网新闻的数量剧增,在这种情况下,如何有效地找到更加符合特定主题的相关报道成为一个迫切需要解决的问题。针对这一问题,提出了基于关键实体和文本摘要多特征融合的话题匹配算法。首先,使用W2NER模型进行命名实... 随着网络的快速普及,互联网新闻的数量剧增,在这种情况下,如何有效地找到更加符合特定主题的相关报道成为一个迫切需要解决的问题。针对这一问题,提出了基于关键实体和文本摘要多特征融合的话题匹配算法。首先,使用W2NER模型进行命名实体识别,通过词频、TF-IDF、词的合群性、词词相似度和词句相似度特征,提取关键的实体。其次,使用Pegasus模型进行文本摘要,通过BiLSTM融合关键实体特征与文本摘要特征,得到新闻文本的深层次语义特征。再次,使用交叉注意力机制对待匹配新闻进行特征交互,增进彼此的联系。最后,融合新闻文本的深层次语义特征和文本交互特征,共同参与文本话题匹配的判断。在来自于搜狐的真实数据上进行了不同算法的对比实验,结果表明:所提算法准确率和精确率均与其他算法效果相近,召回率和F1值均有所提升。 展开更多
关键词 话题匹配 关键实体 文本摘要 文本匹配 信息检索
下载PDF
融合非核心词EDA和SSMix的雷达故障文本分类方法
16
作者 谢雨希 杨江平 +1 位作者 孙知建 胡欣 《火力与指挥控制》 CSCD 北大核心 2024年第4期136-141,共6页
对雷达装备故障文本进行智能化分类,有助于提高雷达装备保障效率。针对雷达故障文本专业性强,样本量小且不平衡的问题,通过非核心词EDA进行类内数据增强,以实现在增加文本量的同时保持关键信息不变。针对非核心词EDA方法产生的新样本多... 对雷达装备故障文本进行智能化分类,有助于提高雷达装备保障效率。针对雷达故障文本专业性强,样本量小且不平衡的问题,通过非核心词EDA进行类内数据增强,以实现在增加文本量的同时保持关键信息不变。针对非核心词EDA方法产生的新样本多样性不够的问题,增加SSMix(saliency-based span mixup for text classification),进行类间数据增强,通过对输入文本非线性的交叉融合来提升文本的多样性。实验证明,与现有的经典基线分类方法和典型数据增强分类方法相比,该方法在准确率上有较大幅度的提升。 展开更多
关键词 雷达故障文本 非核心词EDA SSMix 文本数据增强 分类
下载PDF
基于深度学习的非结构化医学文本知识抽取
17
作者 耿飙 梁成全 +1 位作者 魏炜 朱长元 《计算机工程与设计》 北大核心 2024年第1期177-186,共10页
为解决一词多义和关系重叠问题,以糖尿病领域文本数据为对象,基于序列标注的新型标注策略,提出一种轻量级端到端神经模型。采用头部实体优先策略,使用BERT获取输入字向量,通过BiLSTM深度学习捕获时间特征和上下文相关性。引入multi_head... 为解决一词多义和关系重叠问题,以糖尿病领域文本数据为对象,基于序列标注的新型标注策略,提出一种轻量级端到端神经模型。采用头部实体优先策略,使用BERT获取输入字向量,通过BiLSTM深度学习捕获时间特征和上下文相关性。引入multi_head attention机制,采用CRF模型根据相邻标签的相互依赖关系得到最优预测序列。旨在将非结构化的医学文本转换成结构化的数据,在阿里云天池中文糖尿病标注数据集上进行综合实验,实验结果表明,该模型在医学文本知识抽取中具有优越的性能。 展开更多
关键词 深度学习 非结构化文本 医学文本 知识抽取 实体识别 关系抽取 序列标注
下载PDF
文本视觉问答综述
18
作者 朱贵德 黄海 《计算机工程》 CAS CSCD 北大核心 2024年第2期1-14,共14页
传统视觉问答(VQA)大多只关注图像中的视觉对象信息,忽略了对图像中文本信息的关注。文本视觉问答(TextVQA)除了视觉信息外还关注了图像中的文本信息,能够更加准确并高效地回答问题。近年来,TextVQA已经成为多模态领域的研究热点,在自... 传统视觉问答(VQA)大多只关注图像中的视觉对象信息,忽略了对图像中文本信息的关注。文本视觉问答(TextVQA)除了视觉信息外还关注了图像中的文本信息,能够更加准确并高效地回答问题。近年来,TextVQA已经成为多模态领域的研究热点,在自动驾驶、场景理解等包含文本信息的场景中有重要的应用前景。阐述TextVQA的概念以及存在的问题与挑战,从方法、数据集、未来研究方向等方面对TextVQA任务进行系统性的分析。总结现有的TextVQA研究方法,并将其归纳为3个阶段,分别为特征提取阶段、特征融合阶段和答案预测阶段。根据融合阶段使用方法的不同,从简单注意力方法、基于Transformer方法和基于预训练方法这3个方面对TextVQA方法进行阐述,分析对比不同方法的特点以及在公开数据集中的表现。介绍TextVQA领域4种常用的公共数据集,并对它们的特点和评价指标进行分析。在此基础上,探讨当前TextVQA任务中存在的问题与挑战,并对该领域未来的研究方向进行展望。 展开更多
关键词 文本视觉问答 文本信息 自然语言处理 计算机视觉 多模态融合
下载PDF
文本核重建与扩展实现任意形状文本检测
19
作者 邓胜军 陈念年 《计算机工程与应用》 CSCD 北大核心 2024年第9期228-236,共9页
基于分割的方法对自然场景中的文本进行像素级预测,大幅度提升了对任意形状文本的检测效果,但是如何有效分离相邻文本仍然是检测中的难题。目前广泛采用的方法是通过缩小文本注释边界得到文本核来分离相邻文本。然而,网络预测文本核时... 基于分割的方法对自然场景中的文本进行像素级预测,大幅度提升了对任意形状文本的检测效果,但是如何有效分离相邻文本仍然是检测中的难题。目前广泛采用的方法是通过缩小文本注释边界得到文本核来分离相邻文本。然而,网络预测文本核时舍弃了文本核外大部分信息,降低了基于分割的文本检测方法的性能。为了解决这个问题,提出了一种文本核重建算法,将文本核的生成放在后处理阶段,通过网络预测的方向场将文本实例向内收缩形成文本核。同时,提出了一种文本核扩展算法用于将文本核恢复为完整的文本实例。实验表明,所提方法在Total-Text(88.66%)、CTW-1500(87.28%)和MSRA-TD500(90.65%)三个数据集上取得了相似或最好的检测性能。 展开更多
关键词 场景文本检测 任意形状 文本
下载PDF
改进FCENet的自然场景文本检测算法
20
作者 周燕 廖俊玮 +2 位作者 刘翔宇 周月霞 曾凡智 《计算机工程与应用》 CSCD 北大核心 2024年第3期228-236,共9页
针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模... 针对自然场景文本检测中由于背景复杂、尺度多变、形状弯曲等造成的检测难题,提出了一种改进FCENet(Fourier contour embedding network)的场景文本检测算法。该算法基于FCENet并引入了多尺度残差特征增强模块和多尺度注意力特征融合模块。多尺度残差特征增强模块作为骨干网络顶层的残差分支,增强了特征金字塔结构自上而下的高层语义信息流动,提高了文本像素分类能力,有效减少误检现象。多尺度注意力特征融合模块使不同语义和尺度的特征能够更好地融合,结合自底向上的特征融合网络,有效避免文本过度分割并提高了弯曲文本的检测能力。实验结果表明,该方法在弯曲文本数据集CTW1500和Total-Text上的综合指标F值分别达到了86.2%和86.5%,相比原算法FCENet分别提升了1.1和0.7个百分点。 展开更多
关键词 自然场景文本检测 特征融合 特征增强 注意力机制 FCENet
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部