期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于PCIe级联网口的农业监测视频高速传输系统研究
1
作者 段瑞枫 陈艳 +2 位作者 洪凯 张就 张海燕 《农业机械学报》 EI CAS CSCD 北大核心 2024年第3期203-212,共10页
农业监测智慧化需要实时、高效、可靠的视频数据处理和传输方案,为了解决传统基于CPU和GPU架构的系统速率低、实时性差的问题,设计了基于Zynq架构的PCIe级联网口的高速传输系统。针对PCIe接口开发,在硬件层面,优化配置XDMA IP核参数,完... 农业监测智慧化需要实时、高效、可靠的视频数据处理和传输方案,为了解决传统基于CPU和GPU架构的系统速率低、实时性差的问题,设计了基于Zynq架构的PCIe级联网口的高速传输系统。针对PCIe接口开发,在硬件层面,优化配置XDMA IP核参数,完成接口的数据收发引擎设计,并基于MIG 7 IP核优化配置了DDR缓存区。在软件层面,基于PCIe驱动,调度VLC软件完成视频数据读取,实现板卡和上位机之间数据的快速收发和流畅播放。针对网口协议栈的实现,利用ARM可编程特性,调度LWIP轻量级协议栈,完成TCP协议的开发,实现了网口的数据快速收发,避免了上位机CPU直接处理网络协议的时延和运算开销。此外调度AXI协议完成PCIe接口和网口的高速连通。在Zynq MZ7030FA平台上传输视频文件对系统进行速率和可靠性实测。结果表明:网口传输速率达800 Mb/s,基本实现了千兆以太网;PCIe接口的最高传输速率达816 MB/s,逼近硬件PCIe 2.0 x2的最高速率,且整个系统在应用层上实现了可靠传输。本文的研究为农业监测视频传输应用提供了高效可靠的解决方案,且系统具有较好的扩展性和推广性。 展开更多
关键词 农业监测 高速传输 片上系统 现场可编程门阵列 PCIe高速接口 千兆以太网
下载PDF
基于流行的推荐研究综述
2
作者 雷钦岚 田萱 《计算机科学与探索》 CSCD 北大核心 2024年第5期1109-1134,共26页
目前,基于流行的推荐系统成为研究热点。流行度使得推荐效果得到显著提升,而流行偏差带来的马太效应也引发了研究者的广泛关注,同时一些研究者考虑将二者结合作为混合式流行来实现推荐。采用流行这一概念,对流行度、流行偏差和混合式流... 目前,基于流行的推荐系统成为研究热点。流行度使得推荐效果得到显著提升,而流行偏差带来的马太效应也引发了研究者的广泛关注,同时一些研究者考虑将二者结合作为混合式流行来实现推荐。采用流行这一概念,对流行度、流行偏差和混合式流行进行统一表示。首先介绍流行在推荐领域的应用背景,然后根据不同视角,分别对流行度增强推荐方法、去流行偏差推荐方法和混合式流行推荐方法进行综述。在每类方法中,根据建模的具体子任务或具体策略进行进一步划分,对代表性方法进行分析介绍,评价其优点和局限性等,并详细总结每类方法的方法机制和适用场景,从多方面对不同方法间的联系与区别进行讨论。还介绍了该领域中常用数据集、评价指标和基线算法,并对其中代表性方法进行性能对比分析。最后针对基于流行的推荐研究发展趋势提出一些看法,从多角度对该技术未来的发展难点与热点进行总结与展望。 展开更多
关键词 流行度 流行偏差 混合式流行 基于流行的推荐
下载PDF
基于ERNIE-RCNN梅花研究信息文本分类方法
3
作者 付红萍 陈恺之 陈志泊 《东北农业大学学报》 CAS CSCD 北大核心 2022年第5期20-31,共12页
采用文本分类方法对梅花中文语料按研究方向(基因、育种、非生物胁迫等)进行分类,是构建梅花知识图谱的重要预处理过程,也是对基于以上研究方向的梅花研究信息进行相关语义检索、智能问答等的重要基础。为探究文本分类方法应用于梅花研... 采用文本分类方法对梅花中文语料按研究方向(基因、育种、非生物胁迫等)进行分类,是构建梅花知识图谱的重要预处理过程,也是对基于以上研究方向的梅花研究信息进行相关语义检索、智能问答等的重要基础。为探究文本分类方法应用于梅花研究信息的可行性,提出基于改进ERNIE-RCNN的梅花研究信息文本分类方法。针对缺乏梅花研究信息数据集导致常用文本分类方法分类效果不佳的问题,构建包含6个研究方向的中文梅花研究信息文本数据集;针对传统分类模型的编码机制难以体现文本逻辑性、语义还原不精确的问题,引入预训练模型ERNIE对文本进行编码,在编码过程中增强对文本特征提取与语义表示的能力;为更好保留文本词序及特征,提高分类正确性,在ERNIE模型编码基础上融合TextRCNN模型进行分类,改进TextRCNN模型卷积层丢弃率,增强分类模型泛化性,提高分类能力。通过对改进ERNIE-RCNN模型与仅改进ERNIE的ERNIE-RCNN模型、原始ERNIE-RCNN模型、ERNIE模型、BERT模型以及TextRCNN模型进行对比,试验结果表明,改进ERNIE-RCNN模型在不同评价指标上均高于其他模型,精准率、召回率和F1值分别不小于91.53%、90.27%、92.35%,正确率为95.35%。基于改进ERNIE-RCNN的梅花研究信息文本分类方法可满足实际需要。 展开更多
关键词 梅花 研究信息 文本分类 ERNIE TextRCNN 深度学习
下载PDF
可编辑的根系建模与生长模拟方法
4
作者 杨猛 肖成 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第1期73-80,共8页
针对植物根系种类繁多,形态呈现出高度多样性问题,提出一种可编辑的建模方法来模拟根系生长.首先拓展了传统的L系统,以一种具有语义特征的规则描述根系结构与拓扑关系;然后加入根茎半径与单根长度的连续方程,生成符合自然规律的生长;再... 针对植物根系种类繁多,形态呈现出高度多样性问题,提出一种可编辑的建模方法来模拟根系生长.首先拓展了传统的L系统,以一种具有语义特征的规则描述根系结构与拓扑关系;然后加入根茎半径与单根长度的连续方程,生成符合自然规律的生长;再通过指导向量控制根系的全局形态;最后提供多种编辑根茎局部形状的手段,如根茎骨架、曲面造型、不规则表面等,生成具有自然观感的根茎模型.对自然界中的6种植物进行仿真实验,包括直根系、须根系、储藏根系和板根4种不同类型,结果表明,根系的模拟结果与真实图片的平均相似度达到79.16%,所提方法具有构建多种类型根系的建模能力,可以通过设置形状指导曲线或者调节部分参数,构建出具有特殊形态的真实感根系模型. 展开更多
关键词 根系建模 生长模拟 可编辑模型 指导生长
下载PDF
基于深度学习的新闻推荐算法研究综述 被引量:17
5
作者 田萱 丁琪 +1 位作者 廖子慧 孙国栋 《计算机科学与探索》 CSCD 北大核心 2021年第6期971-998,共28页
新闻推荐(NR)可以有效缓解新闻信息过载,是当今人们获取新闻资讯的重要方式,而深度学习(DL)成为近年来促进新闻推荐发展的主流技术,使新闻推荐的效果得到显著提升,受到研究者们的广泛关注。主要对基于深度学习的新闻推荐方法研究现状进... 新闻推荐(NR)可以有效缓解新闻信息过载,是当今人们获取新闻资讯的重要方式,而深度学习(DL)成为近年来促进新闻推荐发展的主流技术,使新闻推荐的效果得到显著提升,受到研究者们的广泛关注。主要对基于深度学习的新闻推荐方法研究现状进行分类梳理和分析归纳。根据对新闻推荐的核心对象——用户和新闻的建模思路不同,将基于深度学习的新闻推荐方法分为“两段式”方法、“融合式”方法和“协同式”方法三类。在每类方法中,根据建模过程中的具体子任务或基于的数据组织结构进行更进一步细分,对代表性模型进行分析介绍,评价其优点和局限性等,并详细总结每类方法的特点和优缺点。另外还介绍了新闻推荐中常用数据集、基线算法和性能评价指标,最后分析展望了该领域未来可能的研究方向及发展趋势。 展开更多
关键词 新闻推荐(NR) 深度学习(DL) 用户兴趣建模 新闻建模
下载PDF
实体关系抽取方法研究综述 被引量:71
6
作者 李冬梅 张扬 +1 位作者 李东远 林丹琼 《计算机研究与发展》 EI CSCD 北大核心 2020年第7期1424-1448,共25页
在自然语言处理领域,信息抽取一直以来受到人们的关注。信息抽取主要包括3项子任务:实体抽取、关系抽取和事件抽取,而关系抽取是信息抽取领域的核心任务和重要环节.实体关系抽取的主要目标是从自然语言文本中识别并判定实体对之间存在... 在自然语言处理领域,信息抽取一直以来受到人们的关注。信息抽取主要包括3项子任务:实体抽取、关系抽取和事件抽取,而关系抽取是信息抽取领域的核心任务和重要环节.实体关系抽取的主要目标是从自然语言文本中识别并判定实体对之间存在的特定关系,这为智能检索、语义分析等提供了基础支持,有助于提高搜索效率,促进知识库的自动构建.综合阐述了实体关系抽取的发展历史,介绍了常用的中文和英文关系抽取工具和评价体系.主要从4个方面展开介绍了实体关系抽取方法,包括:早期的传统关系抽取方法、基于传统机器学习、基于深度学习和基于开放领域的关系抽取方法,总结了在不同历史阶段的主流研究方法以及相应的代表性成果,并对各种实体关系抽取技术进行对比分析.最后,对实体关系抽取的未来重点研究内容和发展趋势进行了总结和展望. 展开更多
关键词 自然语言处理 实体关系抽取 机器学习 深度学习 开放领域
下载PDF
推荐任务中知识图谱嵌入应用研究综述 被引量:6
7
作者 田萱 陈杭雪 《计算机科学与探索》 CSCD 北大核心 2022年第8期1681-1705,共25页
推荐系统旨在为用户推荐个性化内容以提升用户体验,但目前仍面临着诸如可解释性差、冷启动问题和序列化推荐建模等挑战。近年来,蕴含大量结构化知识和语义信息的知识图谱(KG)被广泛应用于各种推荐任务中以期缓解上述问题。对不同推荐任... 推荐系统旨在为用户推荐个性化内容以提升用户体验,但目前仍面临着诸如可解释性差、冷启动问题和序列化推荐建模等挑战。近年来,蕴含大量结构化知识和语义信息的知识图谱(KG)被广泛应用于各种推荐任务中以期缓解上述问题。对不同推荐任务中知识图谱嵌入(KGE)的创新应用进行系统性综述。首先梳理出采用知识图谱嵌入的三类常见推荐任务以及知识图谱嵌入应用的四种目的;然后根据技术不同归纳总结出四类知识图谱嵌入方法,包括传统嵌入方法、嵌入传播方法、异质图嵌入方法和基于图神经网络的方法;进一步详细阐述了每类方法在不同推荐任务中的使用特点及应用策略,评价其优点和局限性等,并从多个方面对方法间的联系与区别进行定性和定量分析;最后,针对面向不同推荐任务中知识图谱嵌入应用的发展趋势提出一些看法,从多个角度展望了该领域未来值得关注的几个发展方向。 展开更多
关键词 知识图谱嵌入(KGE) 推荐任务 可解释推荐 冷启动 序列化推荐 知识图谱嵌入应用
下载PDF
基于Landsat 8遥感影像的地上生物量模型反演研究 被引量:8
8
作者 周蓉 赵天忠 吴发云 《西北林学院学报》 CSCD 北大核心 2022年第2期186-192,共7页
以吉林省延边朝鲜族自治州汪清县的主要针叶纯林树种为研究对象,结合Landsat 8 OLI数据和地面调查数据,通过提取半径为15 m圆形样地林分尺度下的遥感特征变量实现对地上生物量的估算。首先提取128块样地内的34个遥感特征,其次采用随机... 以吉林省延边朝鲜族自治州汪清县的主要针叶纯林树种为研究对象,结合Landsat 8 OLI数据和地面调查数据,通过提取半径为15 m圆形样地林分尺度下的遥感特征变量实现对地上生物量的估算。首先提取128块样地内的34个遥感特征,其次采用随机森林特征重要性分析遥感特征的贡献率,再利用BP神经网络算法的2种训练算法、SVM支持向量机的3种核函数构建地上生物量模型,最后利用32个测试样本评价模型的估算精度。结果表明,BP神经网络的L-M训练算法和贝叶斯正则化训练算法的R^(2)分别为0.6029、0.6721,RMSE分别为5.0969、4.2637,MAE分别为4.1669、3.2118;SVM支持向量机的线性核函数、RBF核函数、多项式核函数的R^(2)分别为0.5858、0.5619、0.4877,RMSE分别为5.8594、5.6009、5.7637,MAE分别为4.24、3.89、4.176。以贝叶斯正则化训练算法构建地上生物量模型的估测精度最佳;BP神经网络算法比SVM向量机更适用于本研究;同一种机器学习算法不同的训练函数存在差异性。 展开更多
关键词 地上生物量 BP神经网络 SVM支持向量机 遥感影像
下载PDF
定制采伐机数据处理系统设计与实现 被引量:3
9
作者 张航 郭冰峰 +3 位作者 李雯静 李昀 陕晨曦 陈文静 《科学技术创新》 2021年第8期105-109,共5页
基于科研人员对于采伐机数据的研究需要,设计并实现了定制采伐机数据处理系统。通过分析采伐机数据结构特征,实现了pri、hpr、csv三种格式的数据文件的上传功能;针对采伐机数据存在缺失、数据记录过程中造成的不一致、错误等,结合数据... 基于科研人员对于采伐机数据的研究需要,设计并实现了定制采伐机数据处理系统。通过分析采伐机数据结构特征,实现了pri、hpr、csv三种格式的数据文件的上传功能;针对采伐机数据存在缺失、数据记录过程中造成的不一致、错误等,结合数据清洗规则,实现了采伐机数据的清洗;针对科研人员的研究需要,实现了自动计算采伐木胸径和树高、模拟切割、生成干形数据、数据可视化等功能。根据系统分析与用户需求,定制采伐机数据处理系统采用B/S系统架构,选择Django作为服务端框架,Layui为前端页面,MYSQL与Redis作为数据库,采用pandas处理数据。针对大量数据清洗过程的耗时问题,选用多线程与矩阵运算的方式,提高系统运算效率。选用Celery进行任务管理,以任务队列管理方式处理异步任务,避免阻塞问题。 展开更多
关键词 定制采伐机数据 数据处理 数据可视化
下载PDF
直骨架斜接偏移曲线构造等高线的地形算法研究
10
作者 龚勋 杨刚 郭亦非 《地理与地理信息科学》 CSCD 北大核心 2020年第5期1-7,共7页
现有地形生成方法多针对的是自然、随机地形,对具有明确设计需求的地形,尤其是对人工地形自动化生成缺乏深入探讨。针对生产建设中“人工堆垫地形”的高效生成问题,该文提出一种自动化地形生成方法:首先,在分析该类地形形态特征的基础上... 现有地形生成方法多针对的是自然、随机地形,对具有明确设计需求的地形,尤其是对人工地形自动化生成缺乏深入探讨。针对生产建设中“人工堆垫地形”的高效生成问题,该文提出一种自动化地形生成方法:首先,在分析该类地形形态特征的基础上,使用直骨架算法对地形底部平面轮廓图进行区域划分以获得不同的坡面区域,然后采用高效的多边形直骨架斜接偏移算法,构造和编辑阶梯状坡面或曲面坡面,由此可以根据给定参数自动、高效地构造出等高线地形模型。该方法有效扩展了传统直骨架方法的造型能力,对于排土场、梯田和林业景观等地形及边坡的计算机辅助造型设计具有一定的应用价值。 展开更多
关键词 地形建模方法 直骨架 偏移曲线 计算几何 等高线地形图
下载PDF
研究团队研究资源共享平台的研建
11
作者 杨圆飞 田萱 《中国教育信息化》 2020年第11期92-96,共5页
论文、代码及数据集是计算机科学领域的重要研究资源。但论文种类繁多,论文及其相关资源(如代码和数据集)散落在个人电脑上难以查找和共享,导致资源管理效率低、成本高,并容易导致资源泄露或丢失。在当前信息时代,提高研究资源信息化水... 论文、代码及数据集是计算机科学领域的重要研究资源。但论文种类繁多,论文及其相关资源(如代码和数据集)散落在个人电脑上难以查找和共享,导致资源管理效率低、成本高,并容易导致资源泄露或丢失。在当前信息时代,提高研究资源信息化水平具有重要现实意义。文章为北京林业大学信息学院文本挖掘与智能信息处理研究团队设计开发了一套研究资源共享平台,该系统旨在对团队的论文、代码及数据集资源进行统一管理,厘清资源之间的相互关系。该系统具有资源检索、资源上传和下载、数据统计功能,能够帮助团队提升研究效率,节约团队成本。 展开更多
关键词 资源共享 信息管理系统 Spring MVC(Spring Model-Viewer-Controller)框架
下载PDF
迁移学习应用于新型冠状病毒肺炎诊断综述 被引量:1
12
作者 孟伟 袁艺琳 《计算机科学与探索》 CSCD 北大核心 2023年第3期561-576,共16页
新型冠状病毒肺炎(COVID-19)疫情爆发以来,由于该病毒具有极强的传染性,所导致的感染人数与死亡人数持续增加。筛查疑似患者和早期诊断COVID-19是防止疫情恶化的重要措施之一。通过核酸检测和人工检查等方法在感染早期诊断出COVID-19是... 新型冠状病毒肺炎(COVID-19)疫情爆发以来,由于该病毒具有极强的传染性,所导致的感染人数与死亡人数持续增加。筛查疑似患者和早期诊断COVID-19是防止疫情恶化的重要措施之一。通过核酸检测和人工检查等方法在感染早期诊断出COVID-19是防止其在社会中爆发的最佳途径。然而核酸检测效率低下,仅仅依靠放射科专家诊断X射线图像和CT扫描图像存在耗时长且易出现诊断误差等问题。研究人员相继提出了基于迁移学习的计算机辅助诊断算法,可以最大程度地减少传统诊断方法所产生的问题,但目前关于迁移学习在新冠肺炎成像中的应用综述较少,因此总结和分析了当前国内外基于迁移学习技术诊断COVID-19的研究成果。针对模型类型进行分类讨论,分别从数据集来源、数据预处理方法、基于迁移学习的诊断模型、模型可视化、评价指标以及模型性能6个角度进行分析和比较。并指出了当前所面临的挑战和未来的发展方向,为今后进一步的研究工作奠定了基础。 展开更多
关键词 新型冠状病毒肺炎(COVID-19) 迁移学习 计算机辅助诊断 医学影像处理
下载PDF
多标签分类综述
13
作者 李冬梅 杨宇 +3 位作者 孟湘皓 张小平 宋潮 赵玉凤 《计算机科学与探索》 CSCD 北大核心 2023年第11期2529-2542,共14页
多标签分类是指在一个样本中可能会有多个标签同时存在的分类问题,目前已被广泛应用于文本分类、图像分类、音乐及视频分类等领域。与传统的单标签分类问题不同,由于标签之间可能存在相关性或者依赖关系,多标签分类问题变得更加复杂。... 多标签分类是指在一个样本中可能会有多个标签同时存在的分类问题,目前已被广泛应用于文本分类、图像分类、音乐及视频分类等领域。与传统的单标签分类问题不同,由于标签之间可能存在相关性或者依赖关系,多标签分类问题变得更加复杂。近年来,深度学习技术发展迅猛,结合深度学习的多标签分类方法逐渐成为研究热点。因此,从传统的和基于深度学习的角度对多标签分类方法进行了总结,分析了每一种方法的关键思想、代表性模型和优缺点。在传统的多标签分类方法中,分别介绍了问题转换方法和算法自适应方法。在基于深度学习的多标签分类方法中,特别是对最新的基于Transformer的多标签分类方法进行了综述,该方法目前已成为解决多标签分类问题的主流方法之一。此外,介绍了来自不同领域的多标签分类数据集,并简要分析了多标签分类的15个评价指标。最后,从多模态数据多标签分类、基于提示学习的多标签分类和不平衡数据多标签分类三方面对未来工作进行了展望,以期进一步推动多标签分类的发展和应用。 展开更多
关键词 多标签分类 问题转换 算法自适应 深度学习
下载PDF
基于GEE与Sentinel-2影像的落叶针叶林提取
14
作者 王春玲 樊怡琳 +1 位作者 庞勇 荚文 《北京林业大学学报》 CAS CSCD 北大核心 2023年第8期1-15,共15页
【目的】针对森林资源精细监测评价的需求,探索多时相、多特征的Sentinel-2影像在落叶针叶林识别中的应用潜力,根据落叶针叶林的物候特征构建分类模型,为大范围落叶针叶林识别提供方法参考。【方法】基于GEE平台,以黑龙江省孟家岗林场... 【目的】针对森林资源精细监测评价的需求,探索多时相、多特征的Sentinel-2影像在落叶针叶林识别中的应用潜力,根据落叶针叶林的物候特征构建分类模型,为大范围落叶针叶林识别提供方法参考。【方法】基于GEE平台,以黑龙江省孟家岗林场为研究区,分析不同季节落叶针叶林与其他森林之间的差异。研究使用2020年春季(5月7日和5月27日)、夏季(8月9日)和秋季(10月19日)的4景Sentinel-2影像,提取光谱特征、纹理特征和地形特征构建多特征数据集,根据特征重要性得分进行特征优选,最后使用随机森林分类器得到落叶针叶林识别的最佳模型,实现孟家岗林场落叶针叶林的精确提取。【结果】试验结果表明落叶针叶林具有明显的植被光谱特征和季相特性,多时相影像数据包含落叶针叶林更多物候期,春季和秋季的影像更有利于区分落叶针叶林与其他森林。此外,近红外、短波红外波段的光谱信息对识别落叶针叶林有较大帮助。利用GEE平台和多时相Sentinel-2影像可以高效快速地提取植被信息,落叶针叶林提取总体精度与Kappa系数分别达到91.20%,0.82。【结论】基于GEE平台和Sentinel-2影像构建的分类模型对落叶针叶林信息的快速提取有一定的可行性和适用性,研究结果对大面积落叶针叶林的空间位置分布提取具有一定的参考价值。 展开更多
关键词 落叶针叶林 Sentinel-2影像 物候特征 随机森林 GEE平台
下载PDF
基于单目视频的跳台滑雪飞行阶段数据提取方法
15
作者 沈梓祎 杨猛 +4 位作者 杨超 唐伟棣 伍勰 刘宇 盛斌 《系统仿真学报》 CAS CSCD 北大核心 2023年第9期2035-2044,共10页
针对跳台滑雪运动难度系数高,穿戴式传感器等入侵式设备易发生危险且价格昂贵而导致该运动数据提取困难的问题,提出了一种基于单目视频的跳台滑雪飞行阶段的数据提取方法。针对单目视频存在畸变和画面背景杂乱的问题进行预处理,通过标... 针对跳台滑雪运动难度系数高,穿戴式传感器等入侵式设备易发生危险且价格昂贵而导致该运动数据提取困难的问题,提出了一种基于单目视频的跳台滑雪飞行阶段的数据提取方法。针对单目视频存在畸变和画面背景杂乱的问题进行预处理,通过标定相机参数对拍摄画面进行畸变矫正,并使用帧间差分法去除背景;利用OpenPose人体姿态识别库对运动员的关节位置进行初步识别,得到每一帧各个关节点的二维像素坐标;结合跳台滑雪运动员的姿态特性,针对识别出现误差的关节点,提出一种迭代拟合算法对其进行修正;根据修正后的关节点对运动员的运动特征进行提取与计算,并应用生成的人体模型与视频中运动员姿态进行动作比对。实验结果表明,迭代拟合算法提高了关节点识别准确率和识别精度,且修正关节点后生成的SMPL(skinned multiperson linear)三维人体模型更加贴合实际,证明了该算法对关节点修正的有效性。 展开更多
关键词 跳台滑雪飞行阶段 人体关节点检测 坐标修正 二维轨迹提取 三维人体模型对比
原文传递
基于注意力增强的热点感知新闻推荐模型
16
作者 丁琪 田萱 孙国栋 《电子学报》 EI CAS CSCD 北大核心 2023年第1期93-104,共12页
完全个性化的新闻推荐工作通常只基于用户兴趣,可能会导致推荐结果与点击过的内容过于相似甚至重复.事实上即使一些热点新闻并不完全符合用户兴趣,用户也可能希望点击类似的新闻.目前基于热点的新闻推荐方法不能很好挖掘潜在新闻的热点... 完全个性化的新闻推荐工作通常只基于用户兴趣,可能会导致推荐结果与点击过的内容过于相似甚至重复.事实上即使一些热点新闻并不完全符合用户兴趣,用户也可能希望点击类似的新闻.目前基于热点的新闻推荐方法不能很好挖掘潜在新闻的热点特征、灵活平衡用户兴趣和热点特征.本文提出一种新颖的注意力增强的热点感知新闻推荐模型(Hotspot-aware Attention enhaNced model,HAN),充分利用注意力网络和自注意力网络等深度神经网络的优势,在个性化推荐中将个性化兴趣与新闻热点性进行更好平衡与利用.该模型包括新闻编码器、热点特征提取器、用户兴趣提取器和点击预测器四个组件.提出一个热点特征提取器,使用注意力网络动态聚合热点新闻学习热点表示以更好挖掘热点特征;提出一个新颖的点击预测器来灵活融合热点特征、用户兴趣和候选新闻,以提升候选新闻的点击预测准确率.真实数据集上的实验表明HAN模型在AUC(Area Under the Curve of ROC)和F1两项指标上分别提升了7.51%和8.63%,且能够有效缓解用户冷启动问题. 展开更多
关键词 新闻推荐 热点感知 自注意力网络 注意力网络 卷积神经网络
下载PDF
基于深度学习的自然场景文本检测与识别综述 被引量:37
17
作者 王建新 王子亚 田萱 《软件学报》 EI CSCD 北大核心 2020年第5期1465-1496,共32页
自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别... 自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势. 展开更多
关键词 深度学习 自然场景 文本检测 文本识别 端到端
下载PDF
基于语义分割的食品标签文本检测 被引量:10
18
作者 田萱 王子亚 王建新 《农业机械学报》 EI CAS CSCD 北大核心 2020年第8期336-343,共8页
食品包装上的标签文本含有生产日期、营养成分、生产厂家等食品相关信息,这些不仅为消费者购买食品提供了重要依据,也有助于食品监督抽检机构发现潜在的食品安全问题。食品标签文本检测是食品标签自动识别的前提,有助于降低人工录入成... 食品包装上的标签文本含有生产日期、营养成分、生产厂家等食品相关信息,这些不仅为消费者购买食品提供了重要依据,也有助于食品监督抽检机构发现潜在的食品安全问题。食品标签文本检测是食品标签自动识别的前提,有助于降低人工录入成本、提高数据处理效率。基于食品包装图像构建数据集,提出了一种基于语义分割的距离场模型,以检测食品标签。该模型包含像素分类和距离场回归两类任务,其中像素分类任务分割处理图像中的文本区域,距离场回归任务预测文本区域内的像素点到该区域边界的归一化距离。为提升模型的检测性能,在回归预测模块中通过增加注意力模块优化模型结构,并针对距离场回归任务损失值过小、影响模型训练优化问题对其损失函数进行了改进。消融实验结果表明,增加注意力模块和损失函数的改进使得模型的准确率分别提高了4.39、3.80个百分点,有效提高了检测准确率。食品包装图像数据集的对比实验表明,采用本文模型检测食品标签文本具有较好的性能,其召回率、准确率分别达到87.61%、76.50%。 展开更多
关键词 食品标签 语义分割 文本检测 文本识别
下载PDF
基于渐进DS证据理论的空气质量评价方法 被引量:3
19
作者 孙俏 张彤 +1 位作者 王新阳 陈志泊 《北京林业大学学报》 CAS CSCD 北大核心 2022年第3期119-128,共10页
【目的】科学地评价环境空气质量对大气污染防治具有重大的现实意义。环境空气质量的好坏是一个不确定性问题,常用的模糊综合评判法综合了多种大气污染物来评价空气质量,但评价结果往往低于我国空气质量指数(AQI)标准等级,弱化了多种污... 【目的】科学地评价环境空气质量对大气污染防治具有重大的现实意义。环境空气质量的好坏是一个不确定性问题,常用的模糊综合评判法综合了多种大气污染物来评价空气质量,但评价结果往往低于我国空气质量指数(AQI)标准等级,弱化了多种污染物同时超标对空气质量的影响。DS证据理论在处理模糊或不确定等问题时具有很大优势,但是目前较少有DS证据理论评价空气质量的研究。DS证据理论的关键问题是基本概率分配(BPA)和证据冲突可能引起反直觉的结果。【方法】因此本文首先利用Pearson和Spearman相关系数分析了大气污染物浓度数据,确立了高可信度的非线性BPA函数,并提出渐进式DS证据理论策略(Pro-DS)避免了冲突证据的融合问题,建立了环境空气质量综合评价模型。然后将该模型实际应用于2019年天津市空气质量评价,并以国家标准AQI为评价指标,与主因素型与加权型常用的模糊综合评判模型对比。最后本文提出了综合污染相对系数(CPRC)量化了多种污染物对总体空气质量的影响。【结果】以AQI为评价指标,本文模型F1-score比常用的模糊综合评判模型最少提高了4.58%,最大提高了27.46%,验证了本文模型的优越性。由于AQI标准空气质量评价取决于某个污染物而不是综合多个污染物,几种模糊综合评判模型的F1-score都低于50%。以CPRC为评价指标,AQI评价结果的F1-score超过99.1%,几类模糊综合评判模型F1-score都超过89.0%,验证了CPRC的有效性。而Pro-DS模型F1-score为93.1%,综合评价空气质量的模型最优,具有很强的实际应用价值。【结论】Pro-DS模型的综合评价结果低于或高于AQI评价级别,更好地体现了多种污染物对空气质量的综合影响。相比AQI评价方式,本文Pro-DS模型得出了综合空气质量级别的概率值,CPRC指标能够对综合空气质量日排名,为相关部门预防治理空气污染和生态环境工程建设提供实质性参考。 展开更多
关键词 DS证据理论 AQI 模糊综合评判 环境空气质量评价
下载PDF
基于注意力机制神经网络的荒漠区蒸散量模拟 被引量:2
20
作者 齐建东 买晶晶 《农业工程学报》 EI CAS CSCD 北大核心 2020年第22期151-157,共7页
该研究对基于注意力机制的长短期记忆(Attention-Based Long Short Term Memory,AT-LSTM)模型对蒸散量(Evapotranspiration,ET)模拟的可行性和有效性进行验证,以提高环境数据缺失情况下的蒸散量模拟精度。基于盐池县2012—2017年的每30 ... 该研究对基于注意力机制的长短期记忆(Attention-Based Long Short Term Memory,AT-LSTM)模型对蒸散量(Evapotranspiration,ET)模拟的可行性和有效性进行验证,以提高环境数据缺失情况下的蒸散量模拟精度。基于盐池县2012—2017年的每30 min环境数据,利用不同环境因子组合构建基于注意力机制的LSTM模型,并将其与极限学习机(Extreme Learning Machine,ELM)模型、支持向量机(Support Vector Machine,SVM)模型、长短期记忆(Long Short Term Memory,LSTM)模型在日尺度、月尺度和季节尺度上进行对比分析。结果表明:与其他3种模型相比,当输入环境因子变化时,AT-LSTM模型模拟精度变化很小,模拟效果均较好。当输入空气温度、净辐射、相对湿度、土壤温度、土壤含水率所有环境因子时,基于AT-LSTM模型的模拟效果最好,均方根误差(Root Mean Square Error,RMSE)为0.013 mm/30 min,平均绝对误差(Mean Absolute Error,MAE)为0.006 mm/30 min,相关系数(Correlation Coefficient,R)值为0.905。且无论是从小时尺度、日尺度和月尺度来看,AT-LSTM模型的模拟效果均优于其他3种模型。在环境因子缺失的情况下,净辐射对盐池县ET的模拟贡献程度最大,仅输入净辐射时,AT-LSTM模型模拟得到的RMSE和MAE分别为0.014、0.007 mm/30 min,R为0.892。AT-LSTM模型模拟精度高,模型稳定性强,对蒸散量模拟预测具有一定的适用性,仅输入净辐射的AT-LSTM模型可以作为环境数据缺失条件下的蒸散量预测模型。 展开更多
关键词 蒸散量 深度学习 注意力机制 长短期记忆神经网络 盐池县
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部