针对传统方法在石油钻井领域由于检索词不标准、语义模糊导致检索结果偏差较大的问题,提出一种基于BERT(Bidirectional Encoder Representation from Transformers)孪生网络模型的注意力池化方法以提高文献相似度评估的准确率。首先使...针对传统方法在石油钻井领域由于检索词不标准、语义模糊导致检索结果偏差较大的问题,提出一种基于BERT(Bidirectional Encoder Representation from Transformers)孪生网络模型的注意力池化方法以提高文献相似度评估的准确率。首先使用爬虫技术采集石油钻井文献并清洗整理,然后利用5类石油钻井文献数据集评估指标对样本进行打分标注,最后结合钻井文献数据集特征,提出基于孪生BERT网络的注意力池化方法,对多特征样本进行整体语义表达。实验结果表明,相较于常规的池化方法,该模型能提升石油钻井文献相似度度量的效果,并具有一定的泛化性能。展开更多
文摘针对传统方法在石油钻井领域由于检索词不标准、语义模糊导致检索结果偏差较大的问题,提出一种基于BERT(Bidirectional Encoder Representation from Transformers)孪生网络模型的注意力池化方法以提高文献相似度评估的准确率。首先使用爬虫技术采集石油钻井文献并清洗整理,然后利用5类石油钻井文献数据集评估指标对样本进行打分标注,最后结合钻井文献数据集特征,提出基于孪生BERT网络的注意力池化方法,对多特征样本进行整体语义表达。实验结果表明,相较于常规的池化方法,该模型能提升石油钻井文献相似度度量的效果,并具有一定的泛化性能。