为解决知识图谱推荐方法中存在的忽略用户个人信息,或将用户和项目采用相同注意力机制,致使用户和项目的潜在语义表达不充分的问题,提出了一种知识增强的双注意力机制推荐方法。采用交叉压缩融合单元获取用户个人信息和交互历史的潜在特...为解决知识图谱推荐方法中存在的忽略用户个人信息,或将用户和项目采用相同注意力机制,致使用户和项目的潜在语义表达不充分的问题,提出了一种知识增强的双注意力机制推荐方法。采用交叉压缩融合单元获取用户个人信息和交互历史的潜在特征,以增强用户特征表示;使用不同注意力机制关注用户和项目的重要邻居,以增强知识图谱中的结构信息和语义信息表示。为了验证方法的有效性,在MovieLens-1M、MovieLens-20M、Book-Crossing和Last. FM这4个数据集上进行实验,并与RippletNet、KGAT、CKAN等6种方法进行对比分析。结果表明,本文方法与RippletNet、KGCN、LKGR等方法相比,受试者工作特征曲线下面积(area under the receiver operator characteristic curve,AUC)性能平均提升了5.34%。展开更多
文字识别技术在电力系统、车辆驾驶等领域应用十分广泛。随着人工智能技术的兴起和万物互联(Internet of Everything,IoE)的发展,厂商对随时随地获取复杂场景文字的需求也越来越迫切。针对文字识别环境背景复杂、视角畸变、字迹浅显和...文字识别技术在电力系统、车辆驾驶等领域应用十分广泛。随着人工智能技术的兴起和万物互联(Internet of Everything,IoE)的发展,厂商对随时随地获取复杂场景文字的需求也越来越迫切。针对文字识别环境背景复杂、视角畸变、字迹浅显和中英文字符混杂形似等诸多问题,设计出具有文字区域提取与校正、图像增强、文本检测和文本识别的光学字符识别(Optical Character Recognition,OCR)算法框架。设计了基于双注意力机制和内容感知上采样的DBNet文本检测模块增强网络的特征提取选择能力,提高内容感知能力,设计了融入中心损失CRNN+CTC的文本识别模块增大字符之间的特征间距。实验结果表明,改进的文本检测网络在ICDAR2015数据集上准确率提升了5.09%,召回率提高2.12%,F评分提高了3.46%。在中英文文本识别数据集中,改进的文本识别网络对中英文字符识别准确率提高了1.2%。展开更多
精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大,近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展,然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分,难以获得细节丰富...精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大,近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展,然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分,难以获得细节丰富高精度分割影像的问题。文章针对以上问题提出了一种用于建筑物自动提取的深度学习网络结构空洞空间与通道感知网络(Atrous Space and Channel Perception Network,ASCP-Net)。该模型将空洞空间金子塔池化(Atrous Spatial Pyramid Pooling, ASPP)和空间与通道注意力(Spatial and Channel Attention, SCA)模块融入到编码器-解码器结构中,通过ASPP模块来捕获和聚合多尺度上下文信息,采用SCA模块选择性增强特定位置和通道中更有用的信息,并将高低层特征信息输入解码网络完成建筑物信息的高效提取。在WHU建筑数据集(WHU Building Dataset)上进行实验,结果表明:文章提出的方法总体精度和F1评分分别达到了97.4%和94.6%,相比其他模型能够获得更清晰的建筑物边界,尤其对图像边缘不完整建筑的提取效果较好,有效提升了建筑物提取的精度和完整性。展开更多
针对微表情运动的局限性和识别效果不理想的问题,提出了一种结合双注意力模块和ShuffleNet模型的微表情识别方法。该方法将提取的峰值帧的水平和垂直光流图,以通道叠加的方式连接送进所设计的网络进行训练。利用高效且轻量化的ShuffleNe...针对微表情运动的局限性和识别效果不理想的问题,提出了一种结合双注意力模块和ShuffleNet模型的微表情识别方法。该方法将提取的峰值帧的水平和垂直光流图,以通道叠加的方式连接送进所设计的网络进行训练。利用高效且轻量化的ShuffleNet模型堆叠的卷积神经网络(Convolutional neural network,CNN),极大地降低了训练的参数量,在ShuffleNet网络中加入可自适应特征细化的双注意力模块,使得网络在通道和空间维度寻找微表情运动的有用特征信息。在通道注意力模块中,使用一维卷积融合全局池化后的一维通道特征来保持相邻通道的相关性;在空间注意力模块中,采用较小的3×3和5×5卷积核提取不同的空间信息并融合。实验结果表明,在微表情识别方面,相比于基准方法的三个正交平面的局部二值模式(Local binary patterns from three orthogonal planes,LBP-TOP),未加权F1值(Unweighted F1-score,UF1)和未加权平均召回率(Unweighted average recall,UAR)分别提高了0.1445和0.1556,识别性能有很大的提升。展开更多
文摘为解决知识图谱推荐方法中存在的忽略用户个人信息,或将用户和项目采用相同注意力机制,致使用户和项目的潜在语义表达不充分的问题,提出了一种知识增强的双注意力机制推荐方法。采用交叉压缩融合单元获取用户个人信息和交互历史的潜在特征,以增强用户特征表示;使用不同注意力机制关注用户和项目的重要邻居,以增强知识图谱中的结构信息和语义信息表示。为了验证方法的有效性,在MovieLens-1M、MovieLens-20M、Book-Crossing和Last. FM这4个数据集上进行实验,并与RippletNet、KGAT、CKAN等6种方法进行对比分析。结果表明,本文方法与RippletNet、KGCN、LKGR等方法相比,受试者工作特征曲线下面积(area under the receiver operator characteristic curve,AUC)性能平均提升了5.34%。
文摘文字识别技术在电力系统、车辆驾驶等领域应用十分广泛。随着人工智能技术的兴起和万物互联(Internet of Everything,IoE)的发展,厂商对随时随地获取复杂场景文字的需求也越来越迫切。针对文字识别环境背景复杂、视角畸变、字迹浅显和中英文字符混杂形似等诸多问题,设计出具有文字区域提取与校正、图像增强、文本检测和文本识别的光学字符识别(Optical Character Recognition,OCR)算法框架。设计了基于双注意力机制和内容感知上采样的DBNet文本检测模块增强网络的特征提取选择能力,提高内容感知能力,设计了融入中心损失CRNN+CTC的文本识别模块增大字符之间的特征间距。实验结果表明,改进的文本检测网络在ICDAR2015数据集上准确率提升了5.09%,召回率提高2.12%,F评分提高了3.46%。在中英文文本识别数据集中,改进的文本识别网络对中英文字符识别准确率提高了1.2%。
文摘精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大,近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展,然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分,难以获得细节丰富高精度分割影像的问题。文章针对以上问题提出了一种用于建筑物自动提取的深度学习网络结构空洞空间与通道感知网络(Atrous Space and Channel Perception Network,ASCP-Net)。该模型将空洞空间金子塔池化(Atrous Spatial Pyramid Pooling, ASPP)和空间与通道注意力(Spatial and Channel Attention, SCA)模块融入到编码器-解码器结构中,通过ASPP模块来捕获和聚合多尺度上下文信息,采用SCA模块选择性增强特定位置和通道中更有用的信息,并将高低层特征信息输入解码网络完成建筑物信息的高效提取。在WHU建筑数据集(WHU Building Dataset)上进行实验,结果表明:文章提出的方法总体精度和F1评分分别达到了97.4%和94.6%,相比其他模型能够获得更清晰的建筑物边界,尤其对图像边缘不完整建筑的提取效果较好,有效提升了建筑物提取的精度和完整性。
文摘针对微表情运动的局限性和识别效果不理想的问题,提出了一种结合双注意力模块和ShuffleNet模型的微表情识别方法。该方法将提取的峰值帧的水平和垂直光流图,以通道叠加的方式连接送进所设计的网络进行训练。利用高效且轻量化的ShuffleNet模型堆叠的卷积神经网络(Convolutional neural network,CNN),极大地降低了训练的参数量,在ShuffleNet网络中加入可自适应特征细化的双注意力模块,使得网络在通道和空间维度寻找微表情运动的有用特征信息。在通道注意力模块中,使用一维卷积融合全局池化后的一维通道特征来保持相邻通道的相关性;在空间注意力模块中,采用较小的3×3和5×5卷积核提取不同的空间信息并融合。实验结果表明,在微表情识别方面,相比于基准方法的三个正交平面的局部二值模式(Local binary patterns from three orthogonal planes,LBP-TOP),未加权F1值(Unweighted F1-score,UF1)和未加权平均召回率(Unweighted average recall,UAR)分别提高了0.1445和0.1556,识别性能有很大的提升。