-
题名基于transformer的线条图图像检索
- 1
-
-
作者
岳杰
彭炳鑫
-
机构
河北建筑工程学院
-
出处
《河北建筑工程学院学报》
CAS
2024年第1期211-215,共5页
-
文摘
图像检索在计算机视觉中至关重要,在许多领域有着广泛的应用。但是在专利中,图片通常以线条图形式存在。由于线条图没有色彩和纹理信息,对线条图进行检索,仍面临巨大挑战。基于Transformer的线条图检索模型,充分利用Transformer长距离依赖建模的优点,有效的提取线条图全局特征。该模型将输入的线条图切分为n个Patch块,在Patch间通过自注意力机制提取特征,通过对特征进行处理得到100维的增强特征,最终根据图像特征的余弦相似度进行检索。通过实验表明与基于卷积神经网络的GoogleNet和ResNet50相比,基于transformer的模型能达到更好的效果。
-
关键词
TRANSFORMER
图像检索
线条图
计算机视觉
-
Keywords
Transformer
Image Retrieval
Line Drawing
Computer vision
-
分类号
TG333.17
[金属学及工艺—金属压力加工]
-