针对汽车生产设备故障领域命名实体识别过程中存在内在语义信息缺失,传统字向量抽取特征单一的问题,提出一种融合部首特征和BERT的汽车生产设备故障领域命名实体识别模型.首先创建汽车生产设备故障领域拆字字典,实现部首特征提取,融合B...针对汽车生产设备故障领域命名实体识别过程中存在内在语义信息缺失,传统字向量抽取特征单一的问题,提出一种融合部首特征和BERT的汽车生产设备故障领域命名实体识别模型.首先创建汽车生产设备故障领域拆字字典,实现部首特征提取,融合BERT预训练模型生成的动态字向量从而得到联合字向量;然后将联合字向量输入到双向长短期记忆(bidirectional long-short term memory,BiLSTM)进行双向编码,获得长序列语义特征;最后通过条件随机场(conditional random field,CRF)进行序列解码,学习标签之间的依赖关系,得到全局最优序列.将该方法在真实汽车生产设备故障领域数据集上进行实验,得到的精确率、召回率、F1值分别为88.4%、90.2%、89.3%.展开更多
文摘针对汽车生产设备故障领域命名实体识别过程中存在内在语义信息缺失,传统字向量抽取特征单一的问题,提出一种融合部首特征和BERT的汽车生产设备故障领域命名实体识别模型.首先创建汽车生产设备故障领域拆字字典,实现部首特征提取,融合BERT预训练模型生成的动态字向量从而得到联合字向量;然后将联合字向量输入到双向长短期记忆(bidirectional long-short term memory,BiLSTM)进行双向编码,获得长序列语义特征;最后通过条件随机场(conditional random field,CRF)进行序列解码,学习标签之间的依赖关系,得到全局最优序列.将该方法在真实汽车生产设备故障领域数据集上进行实验,得到的精确率、召回率、F1值分别为88.4%、90.2%、89.3%.