针对自动检测口罩佩戴的问题,提出了一种基于深度学习的口罩佩戴识别方法。使用YOLOv3网络为框架构建深度学习模型,并设计和完善了训练数据集。经过对网络模型的训练,成功解决了普通场景中单目标口罩识别问题。同时针对该模型在多目标...针对自动检测口罩佩戴的问题,提出了一种基于深度学习的口罩佩戴识别方法。使用YOLOv3网络为框架构建深度学习模型,并设计和完善了训练数据集。经过对网络模型的训练,成功解决了普通场景中单目标口罩识别问题。同时针对该模型在多目标检测中出现的检测置信度较低和部分目标无法识别等问题,进行了训练加强。通过对测试集的数据进行测试和分析,该方法具有较高的平均准确率(mean average precision, mAP)和稳定性。展开更多
目前基于3D-ConvNet的行为识别算法普遍使用全局平均池化(global average pooling,GAP)压缩特征信息,但会产生信息损失、信息冗余和网络过拟合等问题。为了解决上述问题,更好地保留卷积层提取到的高级语义信息,提出了基于全局频域池化(g...目前基于3D-ConvNet的行为识别算法普遍使用全局平均池化(global average pooling,GAP)压缩特征信息,但会产生信息损失、信息冗余和网络过拟合等问题。为了解决上述问题,更好地保留卷积层提取到的高级语义信息,提出了基于全局频域池化(global frequency domain pooling,GFDP)的行为识别算法。首先,根据离散余弦变换(discrete cosine transform,DCT)看出,GAP是频域中特征分解的一种特例,从而引入更多频率分量增加特征通道间的特异性,减少信息压缩后的信息冗余;其次,为了更好地抑制过拟合问题,引入卷积层的批标准化策略,并将其拓展在以ERB(efficient residual block)-Res3D为骨架的行为识别模型的全连接层以优化数据分布;最后,将该方法在UCF101数据集上进行验证。结果表明,模型计算量为3.5 GFlops,参数量为7.4 M,最终的识别准确率在ERB-Res3D模型的基础上提升了3.9%,在原始Res3D模型基础上提升了17.4%,高效实现了更加准确的行为识别结果。展开更多
文摘针对自动检测口罩佩戴的问题,提出了一种基于深度学习的口罩佩戴识别方法。使用YOLOv3网络为框架构建深度学习模型,并设计和完善了训练数据集。经过对网络模型的训练,成功解决了普通场景中单目标口罩识别问题。同时针对该模型在多目标检测中出现的检测置信度较低和部分目标无法识别等问题,进行了训练加强。通过对测试集的数据进行测试和分析,该方法具有较高的平均准确率(mean average precision, mAP)和稳定性。