-
题名基于BERT-WWM预训练的跨文档三元组提取
被引量:2
- 1
-
-
作者
章振增
-
机构
南威软件股份有限公司
-
出处
《计算机应用与软件》
北大核心
2023年第6期181-186,215,共7页
-
文摘
关于跨文档三元组(Subject Predicate Object,SPO)抽取任务,当前的研究主要基于句子级别的分析。然而很多场景下SPO元素可能分散于文档的各个位置,句子级别的抽取技术远远无法满足需求,因此提出一种Doc2SpSPO联合SPO抽取模型。该模型通过Span候选集模型生成初始实体信息,基于BERT-WWM预训练模型得到上下文以及候选实体相关Embedding信息进行分类任务从而实现SPO的联合提取。实验结果表明,该模型实体识别可达到F1值44.4%、关系分类准确率66.9%的较好效果。
-
关键词
跨文档三元组抽取
BERT
Span规则
联合实体关系抽取模型
-
Keywords
Cross document SPO extraction
BERT
Span rule
Joint entity relationship extraction model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于时间序列模型商品搜索排序
- 2
-
-
作者
章振增
-
机构
上海大学
-
出处
《计算机应用与软件》
2017年第7期282-285,333,共5页
-
文摘
电商商品搜索引擎目前大多都是基于用户浏览行为与购买行为来建立搜索因子,通过这些因子计算出商品分地区的排序分值进行排序。然而这些行为数据都是属于历史数据。搜索的结果都是基于历史数据的分值计算没有前瞻性。特别对于换季商品使用该方式计算出来的搜索结果不佳,转化率不高。提出一种基于时间序列的分析方法,对部分的搜索因子采用预测数据来计算分值,以满足商品搜索中某些具有周期性季节性商品的合适排序。
-
关键词
商品搜索排序
时间序列分析
-
Keywords
Commodity search ranking Time series analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-