语义角色标注的传统方法采用基于句法特征的统计机器学习方法。由于依存句法可以表示词语之间的语义关系,故在语义角色标注中取得了较好的性能;但该方法存在特征抽取过程繁琐,难以捕捉句子中长距离依赖等问题。随着深度学习的兴起,研究...语义角色标注的传统方法采用基于句法特征的统计机器学习方法。由于依存句法可以表示词语之间的语义关系,故在语义角色标注中取得了较好的性能;但该方法存在特征抽取过程繁琐,难以捕捉句子中长距离依赖等问题。随着深度学习的兴起,研究者将基于双向长短时记忆(Bidirectional Long Short-Term Memory,Bi-LSTM)神经网络模型用于语义角色标注。该模型可以自动学习特征,并对词与词之间的远距离依赖关系进行有效建模。本文提出融合Bi-LSTM-CRF模型与依存句法特征的方法,并且引入Gate过滤机制对词向量表示进行调整,以达到利用句法特征提高语义角色标注精度的同时,规避特征工程的繁琐。CPB上的实验结果表明,利用本文所提方法的汉语语义角色标注的F1值达到79.53%,比前人的方法有了较为显著的提升。展开更多
针对传统命名实体识别需要大量人工及规则信息的问题,提出一种基于条件随机场(conditional random field, CRF)和双向长短时记忆(bi-directional long short-term memory, BI-LSTM)神经网络的命名实体识别方法。其中,CRF模型在进行中文...针对传统命名实体识别需要大量人工及规则信息的问题,提出一种基于条件随机场(conditional random field, CRF)和双向长短时记忆(bi-directional long short-term memory, BI-LSTM)神经网络的命名实体识别方法。其中,CRF模型在进行中文分词的时候考虑到了未登录词的问题,具备较好的学习能力;双向长短期神经网络能够很好地保留上下文信息的特性。通过使用北京大学标注的1998年人民日报语料库对所提方法进行实验,结果表明:Dropout参数对命名实体识别的效果存在积极影响;同时当Dropout参数取不变时,双向LSTM模型比单向LSTM模型(long short-term memory, LSTM)在中文命名实体识别任务中取得了更好的识别效果。展开更多
文摘语义角色标注的传统方法采用基于句法特征的统计机器学习方法。由于依存句法可以表示词语之间的语义关系,故在语义角色标注中取得了较好的性能;但该方法存在特征抽取过程繁琐,难以捕捉句子中长距离依赖等问题。随着深度学习的兴起,研究者将基于双向长短时记忆(Bidirectional Long Short-Term Memory,Bi-LSTM)神经网络模型用于语义角色标注。该模型可以自动学习特征,并对词与词之间的远距离依赖关系进行有效建模。本文提出融合Bi-LSTM-CRF模型与依存句法特征的方法,并且引入Gate过滤机制对词向量表示进行调整,以达到利用句法特征提高语义角色标注精度的同时,规避特征工程的繁琐。CPB上的实验结果表明,利用本文所提方法的汉语语义角色标注的F1值达到79.53%,比前人的方法有了较为显著的提升。