期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向化学资源文本的命名实体识别 被引量:6
1
作者 马建红 王立芹 姚爽 《郑州大学学报(理学版)》 CAS 北大核心 2018年第4期14-20,共7页
针对化学资源文本中的命名实体,提出一种适合于化学资源文本的命名实体识别方法,旨在将化学物质、属性、参数、量值4种命名实体进行识别.该方法根据化学资源文本的语言规律及特点,建立BLSTM-CRF模型对命名实体进行初步识别,并使用基于... 针对化学资源文本中的命名实体,提出一种适合于化学资源文本的命名实体识别方法,旨在将化学物质、属性、参数、量值4种命名实体进行识别.该方法根据化学资源文本的语言规律及特点,建立BLSTM-CRF模型对命名实体进行初步识别,并使用基于词典与规则相结合的方法对识别结果进行校正.实验结果表明,该方法在化学资源文本中能够较好地完成命名实体识别任务,在测试语料上的F1值最高能达到94.26%. 展开更多
关键词 化学资源文本 命名实体识别 双向长短时记忆网络 条件随机场 规则
下载PDF
面向高中化学试题的命名实体识别
2
作者 张璐 马子睿 +1 位作者 王岳 马翠玲 《吉林大学学报(信息科学版)》 CAS 2023年第4期608-620,共13页
中文化学命名实体结构没有严格的构词规律可循,识别实体中包含字母、数字、特殊符号等多种形式,传统字向量模型无法有效区分化学术语中存在的嵌套实体和歧义实体。为此,将高中化学试题资源的命名实体划分为物质、性质、量值、实验四大类... 中文化学命名实体结构没有严格的构词规律可循,识别实体中包含字母、数字、特殊符号等多种形式,传统字向量模型无法有效区分化学术语中存在的嵌套实体和歧义实体。为此,将高中化学试题资源的命名实体划分为物质、性质、量值、实验四大类,并构建化学学科实体词汇表辅助人工标注。通过ALBERT预训练模型提取文本特征并生成动态字向量,结合BILSTM-CRF(Bidirectional Long Short-Term Memory with Conditional Random Field)模型对高中化学试题文本进行命名实体识别。实验结果表明,该模型的精确率、召回率和F1值分别达到了95.24%、95.26%、95.25%。 展开更多
关键词 命名实体识别 ALBERT预训练模型 双向长短期记忆网络 条件随机场 化学资源文本
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部