题名 大语言模型技术融入数据库课程的教学探索
1
作者
王晓玲
岳文静
王昊奋
徐飞
机构
华东师范大学计算机科学与技术学院
同济大学设计创意学院
出处
《计算机教育》
2024年第9期28-32,共5页
基金
国家自然科学基金项目(61972155)。
文摘
针对目前数据库课程知识引入前沿技术不足,课程的实践项目无法满足培养实践性人才的问题,提出在数据库课程中引入大语言模型技术的教学方式,分析大语言模型技术融入数据库课程的教学目标和挑战,给出教学设计框架,介绍具体的教学设计和实施,最后说明课程教学效果。
关键词
大语言模型技术
数据库课程
前沿技术
教学设计
教学计划
分类号
G642
[文化科学—高等教育学]
题名 大语言模型驱动的选址推荐系统
被引量:1
2
作者
高云帆
郁董卿
王思琪
王昊奋
机构
上海自主智能无人系统科学中心(同济大学)
尼斯索菲亚综合理工学院数学学院
同济大学设计创意学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第7期1681-1696,共16页
基金
国家自然科学基金项目(62176185)
信息系统工程全国重点实验室开放基金(PU52221147)
土木工程I类高峰学科建设项目(2022-3-YB-02)。
文摘
选址作为商业决策和城市基础设施规划的核心环节,对实体店铺、城市基础设施能否发挥预期效用具有重要作用.现有的选址推荐系统数据服务编排较为固定,无法对不同用户需求系统做出及时调整,应用场景受限,人机交互的系统灵活性和可扩展性差.最近,以GPT-4为代表的大语言模型(large language model,LLM)展现出了强大的意图理解、任务编排、代码生成和工具使用能力,能够完成传统推荐模型难以兼顾的任务,为重塑推荐流程、实现一体化的推荐服务提供了新的机遇.然而,一方面选址推荐兼具传统推荐共有的挑战;另一方面,由于其基于空间数据,具有独特的挑战.在这一背景下,提出了大语言模型驱动的选址推荐系统.首先,拓展了选址推荐的场景,提出了根据位置寻找合适店铺类型的场景推荐任务,结合了协同过滤算法和空间预训练模型.其次,构建了由大语言模型驱动的选址决策引擎.语言模型本身在处理空间相关的任务上存在诸多缺陷,例如缺少空间感知能力、无法理解具体位置、会虚构地名地址等.提出了一种在语言模型框架处理空间任务的机制,通过地理编码、逆编码、地名地址解析等工具提升模型的空间感知能力并避免地址虚构问题,结合选址推荐模型、场景推荐模型、外部知识库、地图可视化完成选址推荐中的多样化任务.实现选址任务的智能规划、执行与归因,提升了空间服务系统的交互体验,为未来人工智能驱动的选址推荐系统提供新的设计和实现思路.
关键词
选址推荐
推荐系统
大语言模型
智能代理
地理空间分析
Keywords
site selection recommendation
recommender system
large language model
agent
geospatial analysis
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 面向远程监督命名实体识别的噪声检测
3
作者
王嘉诚
王凯
王昊奋
杜渂
何之栋
阮彤
刘井平
机构
华东理工大学信息科学与工程学院
同济大学设计与创意学院
迪爱斯信息技术股份有限公司
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第4期916-928,共13页
基金
上海市促进产业高质量发展专项资金(2021-GZL-RGZN-01018)
国家重点研发计划项目(2021YFC2701800,2021YFC2701801)
+1 种基金
之江实验室开放课题(2019ND0AB01)
上海市青年科技英才扬帆计划项目(23YF1409400)。
文摘
针对远程监督命名实体识别(named entity recognition,NER)任务,目前有许多基于强化学习的方法,利用强化学习的强大决策能力,对远程监督生成的自动标注数据进行噪声过滤.然而,这些方法所使用的策略网络模型架构都较简单,识别噪声能力较弱,且都以完整的句子样本为单位进行识别,导致句子中的部分正确信息被丢弃.为解决上述问题,提出了一种新的基于强化学习的方法,称为RLTL-DSNER,该方法可以从远程监督生成的带噪数据中,以单词级别识别正确实例,减少噪声实例对远程监督NER的负面影响.具体来说,在策略网络模型中引入了标签置信函数来准确识别实例.此外,提出了一种新颖的NER模型预训练策略,使其能为强化学习的初始训练提供精准的状态表示和有效的奖励值,引导其向正确的方向更新.在4个数据集上的实验结果验证了RLTL-DSNER方法的优越性,在NEWS数据集上,相较于现有最先进的方法,获得了4.28%的F1提升.
关键词
命名实体识别
远程监督
深度强化学习
噪声检测
预训练策略
Keywords
named entity recognition
distant supervision
deep reinforcement learning
noise detection
pre-training strategy
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于细粒度特征融合的部分多模态哈希
4
作者
殷崭祚
李博涵
王萌
黄瑞龙
吴文隆
王昊奋
机构
南京航空航天大学计算机科学与技术学院
软件新技术与产业化协同创新中心
空天地海一体化大数据应用技术国家工程实验室(西北工业大学)
同济大学设计创意学院
出处
《软件学报》
EI
CSCD
北大核心
2024年第3期1074-1089,共16页
基金
国家重点研发计划(2020YFB1708100)
“十四五”民用航天技术预先研究项目(D020101)
+2 种基金
国家自然科学基金(62172351)
高安全系统的软件开发与验证技术工业和信息化部重点实验室资助项目(NJ2018014)
河北省软件工程重点实验室项目。
文摘
多模态数据的指数级增长使得传统数据库在存储和检索方面遇到挑战,而多模态哈希通过融合多模态特征并映射成二进制哈希码,能够有效地降低数据库的存储开销并提高其检索效率.虽然目前已经有许多针对多模态哈希的工作取得了较好的效果,但是仍然存在着3个重要问题:(1)已有方法偏向于考虑所有样本都是模态完整的,然而在实际检索场景中,样本缺失部分模态的情况依然存在;(2)大多数方法都是基于浅层学习模型,这不可避免地限制了模型的学习能力,从而影响最终的检索效果;(3)针对模型学习能力弱的问题已提出了基于深度学习框架的方法,但是它们在提取各个模态的特征后直接采用了向量拼接等粗粒度特征融合方法,未能有效地捕获深层语义信息,从而弱化了哈希码的表示能力并影响最终的检索效果.针对以上问题,提出了PMH-F^(3)模型.该模型针对样本缺失部分模态的情况,实现了部分多模态哈希.同时,基于深层网络架构,利用Transformer编码器,以自注意力方式捕获深层语义信息,并实现细粒度的多模态特征融合.基于MIRFlickr和MSCOCO数据集进行了充分实验并取得了最优的检索效果.实验结果表明:所提出的PMH-F^(3)模型能够有效地实现部分多模态哈希,并可应用于大规模多模态数据检索.
关键词
部分多模态哈希
多模态数据检索
细粒度特征融合
Keywords
partial multimodal hashing
multimodal data retrieval
fine-grained feature fusion
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 知识图谱赋能的知识工程:理论、技术与系统专题序言
被引量:5
5
作者
王鑫
汤庸
王昊奋
李博涵
Jianxin LI
机构
天津大学
华南师范大学
同济大学
南京航空航天大学
Deakin University
出处
《计算机科学》
CSCD
北大核心
2023年第3期1-2,共2页
文摘
知识图谱是人工智能在知识工程理论和技术发展中的前沿。知识图谱方法、技术与应用在新一代人工智能由“感知智能”迈向“认知智能”的过程中扮演重要角色。近年来,随着大规模知识图谱的发布和知识图谱赋能系统的应用,国内外学术界和产业界均在多个维度对知识图谱赋能的知识工程进行了研究与开发。虽然国内外学者在知识图谱及相关方向上已取得若干研究成果,但知识图谱赋能的知识工程尚未形成成熟的理论体系、技术方法、应用与系统实践,仍有众多有待解决的具有挑战性的难题。本专题旨在促进知识图谱赋能的知识工程研究、开发与应用,及时、集中、全面地报道知识图谱赋能的知识工程在理论、方法、技术、系统与应用实践等方面的最新成果和进展。
关键词
知识图谱
人工智能
研究与开发
赋能
研究成果
理论体系
应用实践
理论和技术
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 中文开放链接医疗数据的构建
被引量:8
6
作者
王昊奋
张金康
程小军
机构
上海交通大学计算机科学与工程系
上海林康医疗信息技术有限公司
出处
《中国数字医学》
2013年第4期5-8,15,共5页
文摘
医疗知识库是一个主要面向医学专业人员的知识仓库,是临床决策支持系统、医院管理信息系统等上层信息化应用的底层基础:其目标是帮助提高临床医疗质量、提供临床决策支持,即在诊疗过程中对症状、疾病、手术等信息进行快速查找匹配,从而提升医疗质量。参照开放链接数据的最佳实践,结合各种医疗应用,首次发布了中文医疗链接数据。详细介绍了数据的收集、异构数据的集成和提供的SPARQL查询服务。在此基础上,介绍了应用知识库的两个已有应用,并展望潜在的未来应用。
关键词
医疗知识库开放链接数据语义技术本体
Keywords
medical knowledge base, open linked data, semantic technology,ontology
分类号
R197.324
[医药卫生—卫生事业管理]
题名 中医药知识图谱构建与应用
被引量:97
7
作者
阮彤
孙程琳
王昊奋
方之家
殷亦超
机构
华东理工大学
上海曙光医院
出处
《医学信息学杂志》
CAS
2016年第4期8-13,共6页
基金
国家高技术研究发展计划“心血管疾病与肿瘤疾病中西医临床大数据处理分析与应用研究”(项目编号:2015AA020107)
文摘
在调研国内外通用和医疗行业专用知识图谱的基础上利用文本抽取、关系数据转换以及数据融合等技术,探索中医药知识图谱自动化构建方法与标准化流程,实现中医药知识图谱的智能应用,包括基于模板的中医药知识问答和基于知识图谱推理的辅助开药。
关键词
中医药知识图谱
知识问答
知识推理
Keywords
Traditional Chinese medicine knowledge graph
Question answering
Knowledge inference
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
R2-03
[医药卫生—中医学]
题名 电子病历文本症状自动识别方法
被引量:6
8
作者
龚凡
王梦婕
阮彤
王昊奋
陆灏
机构
上海中医药大学附属曙光医院
华东理工大学
上海中医院大学附属曙光医院
出处
《医学信息学杂志》
CAS
2016年第7期7-14,共8页
基金
上海市中医药事业发展三年行动计划(项目编号:ZY3-CCCX-2-1003)
国家高技术研究发展计划"心血管疾病与肿瘤疾病中西医临床大数据处理分析与应用研究"(项目编号:2015AA020107)
文摘
基于症状体系识别的难点,提出一种创新的基于症状构成模式的非监督学习方法来实现电子病历症状实体的自动抽取,介绍其总体过程并与基于CRF序列标注的监督学习方法进行比较,试验证明本文所提出的方法具有良好的识别效果和可扩展性。
关键词
医疗实体抽取
症状构成模式
结构化电子病历
Keywords
Medical entity extraction
Symptom composition pattern
Structured Electronic Medical Records
分类号
R197.323
[医药卫生—卫生事业管理]
题名 基于知识增强的医学语言模型:现状、技术与应用
被引量:3
9
作者
康砚澜
郭倩宇
张文强
王昊奋
机构
复旦大学工程与应用技术研究院
复旦大学计算机学院
同济大学
出处
《医学信息学杂志》
CAS
2023年第9期12-22,共11页
基金
国家自然科学基金项目(项目编号:62176185)。
文摘
目的/意义介绍生成式语言模型在医学领域的应用现状和挑战,并提出一种基于知识增强的医学语言模型,以提高模型专业性、准确性和可信性,为医学、语言模型及知识图谱领域相关研究人员提供参考。方法/过程回顾大语言模型的发展、现状及主要技术,分析其在数据安全、专业性、伦理规范和模型可解释性等方面面临的挑战。介绍医学生成式语言模型常见应用场景和技术要点,重点阐述基于知识图谱和多模态数据融合知识增强的医学语言模型,包括其优势、技术原理和具体案例。结果/结论知识增强的医学语言模型可提高语言模型对专业医学知识的理解、认知和应用能力,增强对自然语言的生成能力,拓展对多模态数据的处理能力,在医疗问答、智能辅助诊断、个性化医疗决策等方面具有广泛应用前景。
关键词
生成式语言模型
医学问答
知识图谱
人工智能
医疗
Keywords
generative language model
medical question answering
knowledge graph
artificial intelligence(AI)
medical treatment
分类号
R-058
[医药卫生]
题名 基于规则推理引擎的实体关系抽取研究
被引量:9
10
作者
薛丽娟
席梦隆
王梦婕
王昊奋
阮彤
机构
华东理工大学信息科学与工程学院
出处
《计算机科学与探索》
CSCD
北大核心
2016年第9期1310-1319,共10页
基金
上海市经信委"软件和集成电路产业发展专项资金"No.140304~~
文摘
实体关系抽取是指从无结构的自然语言文本中抽取实体之间的语义关系,并以结构化的形式表示出来。传统的实体关系抽取方法只注重一种特定类型的数据源,并需要标注大量的训练数据来训练抽取模型,人工成本高。因此提出了一种综合多种数据源,并结合规则推理引擎的实体关系抽取方法,准确地说就是综合结构化和非结构化两种数据源,在结构化数据提供少量种子的情况下用规则推理引擎推理出更多的实体关系。然后使用远程监督学习方法从无结构的文本中抽取实体关系,通过多次迭代获得最终的实体关系。实验结果证明了该方法的有效性。
关键词
关系抽取
关系推理
远程监督
规则推理引擎
Keywords
relation extraction
relation reasoning
distant supervision
rule-based inference engine
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 知识驱动的游戏攻略自动标注算法
被引量:4
11
作者
陈环环
陈小红
阮彤
高大启
王昊奋
机构
华东理工大学计算机科学与工程系
盛趣信息技术(上海)有限公司
出处
《计算机应用》
CSCD
北大核心
2017年第1期278-283,共6页
基金
国家自然科学基金资助项目(61402173)
上海经信委"软件集成电路产业发展专项资金"项目(140304)~~
文摘
为了帮助用户快速检索感兴趣的游戏攻略,提出了知识驱动的游戏攻略自动标注算法。首先,对每款游戏的多个资讯网站进行融合,自动构建游戏领域知识库;然后,再通过游戏领域词汇发现算法和决策树分类模型,抽取游戏攻略中的游戏术语;由于游戏术语在攻略中大多以简称的形式存在,故最后将攻略中游戏术语和知识库进行链接得到该术语所对应的全称即语义标签对攻略进行标注。在多款游戏上的实验结果表明,所提出的游戏攻略标注方法的准确率高达90%。同时,游戏领域词汇发现算法与其他术语抽取方法 n-gram语言模型相比取得了更好的效果。
关键词
游戏攻略
知识库
游戏术语
语义标签
决策树
Keywords
game strategy
knowledge base
game term
semantic tag
decision tree
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 基于领域本体的游戏攻略文本标注算法研究与实现
被引量:2
12
作者
陈小红
陈环环
方之家
阮彤
王昊奋
机构
盛大游戏
华东理工大学计算机科学与工程系
出处
《计算机应用与软件》
2017年第2期80-86,共7页
基金
国家自然科学基金项目(61402173)
上海市经信委软件和集成电路产业专项资金(140304)
文摘
游戏门户网站为提升玩家们的游戏体验,建立了大量站点用以提供游戏资讯及相关攻略。然而这些站点间异构现象明显,且缺乏统一的知识体系。提出基于领域本体的文本标注算法,通过融合站点间的数据,构建游戏领域本体。同时,针对游戏领域的应用,优化了新词发现算法,并进一步对攻略文本进行语义标注。通过这些语义标签,不仅能直观地了解攻略中的内容,也能更好地为攻略文本的语义检索服务。实验证明,所提出的本体构建方法在游戏领域具有一定的推广性,同时游戏领域词汇发现算法与传统的分词工具相比也取得了更好的结果。
关键词
领域本体
游戏领域词汇发现算法
语义标注
Keywords
Domain ontology
Game domain vocabulary discovering algorithm
Semantic annotation
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 融合大模型的多模态知识图谱及在金融业的应用
被引量:4
13
作者
王文广
王昊奋
机构
达而观信息科技(上海)有限公司
同济大学设计创意学院
出处
《人工智能》
2023年第2期18-28,40,共12页
文摘
本文综述了最新的多模态知识图谱的构建和应用技术以及知识图谱在金融行业各业务场景的最新应用。特别地,综述了GPT等大模型用于知识图谱构建,以及知识图谱支撑大模型应用等方面的最新进展,揭示了大模型、多模态和知识图谱三者融合的巨大潜力。同时,本文还探讨了未来知识图谱研究和应用的三大机会——更容易构建知识图谱,扩展知识图谱的研究范畴,融合大模型与知识图谱以拓宽应用范围。最后,本文还探讨了以人为本的通用人工智能有关的内容。
关键词
多模态知识图谱
大模型
金融知识图谱
通用人工智能
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
F832
[经济管理—金融学]
题名 新一代知识图谱关键技术综述
被引量:52
14
作者
王萌
王昊奋
李博涵
赵翔
王鑫
机构
东南大学计算机科学与工程学院
同济大学创意设计学院
南京航空航天大学计算机学院
国防科技大学信息系统工程国家重点实验室
天津大学智能与计算学部
出处
《计算机研究与发展》
EI
CSCD
北大核心
2022年第9期1947-1965,共19页
基金
国家重点研发计划项目(2019YFE0198600)
国家自然科学基金项目(61906037,62176185,62072099,61872446,61972275)
中央高校基本科研业务费专项资金(22120210109)。
文摘
近年来,国内外在新一代知识图谱的关键技术和理论方面取得了一定进展,以知识图谱为载体的典型应用也逐渐走进各个行业领域,包括智能问答、推荐系统、个人助手等.然而,在大数据环境和新基建背景下,数据对象和交互方式的日益丰富和变化,对新一代知识图谱在基础理论、体系架构、关键技术等方面提出新的需求,带来新的挑战.将综述国内外新一代知识图谱的关键技术研究发展现状,重点从非结构化多模态数据组织与理解、大规模动态图谱表示学习与预训练模型、神经符号结合的知识更新与推理3方面对国内外研究的最新进展进行归纳、比较和分析.最后,就未来的技术挑战和研究方向进行展望.
关键词
知识图谱
多模态数据
表示学习
预训练模型
认知智能
神经符号系统
Keywords
knowledge graph
multi-modal data
representation learning
pre-training models
cognitive intelligence
neural-symbolic systems
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 知识图谱可视化查询技术综述
被引量:22
15
作者
王鑫
傅强
王林
徐大为
王昊奋
机构
天津大学智能与计算学部
天津泰凡科技有限公司
同济大学设计创意学院
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第6期1-11,共11页
基金
国家自然科学基金(61972275)
天津市自然科学基金(17JCYBJC15400)。
文摘
知识图谱作为符号主义发展的产物,是人工智能技术和系统中的重要组成部分,其在百科知识、生物信息、社交网络以及网络安全等领域被广泛运用。知识图谱可视化查询是理解和分析知识图谱的重要技术,能够帮助普通用户有效地查询知识图谱。分类介绍知识图谱的数据模型和可视化技术,从数据规模的角度描述大规模知识图谱可视化的一般步骤。分析基于RDF图和属性图的可视化查询语言、基于关键字、过滤和模板的可视化查询系统,以及本体可视化查询方法,从可读性、可学习性、用户友好度等方面对现有知识图谱可视化查询技术进行对比总结,阐述可视化查询在领域知识图谱中的应用现状,并对知识图谱可视化查询的未来发展方向加以展望。
关键词
知识图谱
查询语言
可视化技术
可视化查询
本体可视化
Keywords
knowledge graph
query language
visualization technology
visualization query
ontology visualization
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 大规模企业级知识图谱实践综述
被引量:47
16
作者
王昊奋
丁军
胡芳槐
王鑫
机构
同济大学设计创意学院
海乂知信息科技(南京)有限公司
天津大学智能与计算学部
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第7期1-13,共13页
基金
国家自然科学基金(61972275)。
文摘
近年来,知识图谱及其相关技术得到快速发展,并被广泛应用于工业界各种认知智能场景中。在简述知识图谱相关研究的基础上,介绍知识图谱在工程应用中的关键技术,研究工业级知识图谱的典型应用场景与案例、具有代表性的工业级知识图谱平台以及知识图谱生命周期过程中的相关可用工具,分析企业级知识图谱平台的构建需求和面临的问题,阐述企业级知识图谱平台的构建方法及过程。针对平台化建设中遇到的问题给出相应的知识图谱中台解决方案,并对知识图谱未来的发展与挑战进行展望。
关键词
知识图谱
表示学习
知识抽取
知识存储
知识推理
企业级知识图谱平台
知识图谱中台
Keywords
knowledge graph
representation learning
knowledge extraction
knowledge storage
knowledge reasoning
enterprise-level knowledge graph platform
knowledge graph middle platform
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 多模态态势感知的知识表示、表示学习和知识推理
被引量:8
17
作者
王昊奋
易侃
吴蔚
胡芳槐
机构
同济大学设计创意学院
信息系统工程重点实验室
海乂知信息科技(南京)有限公司
出处
《指挥信息系统与技术》
2022年第3期1-11,共11页
基金
国家自然科学基金(62176185)资助项目。
文摘
针对多模态态势存在知识表示困难、知识化过程复杂、多模态知识难以融合、知识智能应用程度低等难题,提出了面向战场态势感知多模态数据及知识的统一知识表示模型,实现了事实类知识、动态事件、规则知识和多模态知识等高效表示。在此基础上,引入基于知识图谱的表示学习技术,为多模态数据及知识的统一处理提供了方法,可支撑多模态知识的提取、融合、补全和联合学习,从而实现战场态势感知知识图谱的构建;最后,以表示学习为基础,提出了基于态势感知知识图谱的知识推理框架,实现能力强、高效率、可解释的复合推理,为上层应用提供实现途径。
关键词
态势感知
知识图谱
知识表示
表示学习
知识推理
Keywords
situational awareness(SA)
knowledge graph
knowledge representation
representation learning
knowledge reasoning
分类号
TP202
[自动化与计算机技术—检测技术与自动化装置]
题名 基于知识图谱的医疗病历数据存储研究
被引量:15
18
作者
夏宇航
高大启
阮彤
王昊奋
殷亦超
机构
华东理工大学信息科学与工程学院
深圳狗尾草智能科技有限公司
上海中医药大学附属曙光医院
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第1期9-16,22,共9页
基金
国家高技术研究发展计划(2015AA020107)
文摘
基于关系数据库的资源描述框架(RDF)存储方案多数未考虑领域特性而造成查询性能不足。为此,提出一种改进的病历图谱存储方案。根据原始病历数据具有多元关系的特征,设计多元关系到RDF三元组的转化方案。基于原始病历数据具有空值多、谓词数量多且谓词不固定等特性,采用基于改进三元组表的存储方案,将病历RDF三元组的实体和属性进行ID化。在此基础上,设计实体类型表,面向病历图谱使用SPARQL-to-SQL查询转换算法。实验结果表明,与基于类型的存储方案相比,该方案具有较高的查询效率。
关键词
医疗病例
知识图谱
数据存储
查询效率
统计分析
Keywords
medical record
knowledge graph
data storage
query efficiency
statistical analysis
分类号
TP392
[自动化与计算机技术—计算机应用技术]
题名 知识图谱多跳问答推理研究进展、挑战与展望
被引量:11
19
作者
杜会芳
王昊奋
史英慧
王萌
机构
同济大学设计创意学院
东南大学网络空间与安全学院
东南大学计算机科学与工程学院
出处
《大数据》
2021年第3期60-79,共20页
基金
中央高校基本科研业务专项资金资助项目(No.22120210109)。
文摘
近年来,知识图谱问答在医疗、金融、政务等领域被广泛应用。用户不再满足于关于实体属性的单跳问答,而是更多地倾向表达复杂的多跳问答需求。为了应对上述复杂多跳问答,各种不同类型的推理方法被陆续提出。系统地介绍了基于嵌入、路径、逻辑的多跳知识问答推理的最新研究进展以及相关数据集和评测指标,并重点围绕前沿问题进行了讨论。最后总结了现有方法的不足,并展望了未来的研究方向。
关键词
知识图谱
多跳问答
推理
Keywords
knowledge graph
multi-hop question answering
reasoning
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 垂直知识图谱的构建与应用研究
被引量:45
20
作者
阮彤
王梦婕
王昊奋
胡芳槐
机构
华东理工大学信息学院
华东理工大学计算机科学与工程系
上海海翼知信息科技有限公司
出处
《知识管理论坛》
2016年第3期226-234,共9页
基金
国家高技术研究发展计划"心血管疾病与肿瘤疾病中西医临床大数据处理分析与应用研究"(项目编号:2015AA020107)研究成果之一
文摘
[目的/意义]近年来,知识图谱技术受到学术界和工业界的普遍关注。提出数据驱动的增量式知识图谱构建方法,为构建垂直知识图谱提供一种新思路。同时,通过3个用例研究提供垂直知识图谱的应用示范。[方法/过程]首先给出知识图谱的形式化定义,然后提出数据驱动的增量式知识图谱构建方法,重点研究构建垂直知识图谱数据图的细节与难点。基于该方法,本文构建了中医药知识图谱、海洋知识图谱和企业知识图谱。[结果/结论]以上垂直知识图谱的构建证实了本方法的可行性,它们各自的垂直应用体现了知识图谱的广泛应用。
关键词
知识获取
知识融合
语义搜索
辅助开方
关系发现
Keywords
knowledge graph
knowledge acquisition
knowledge fusion
semantic search
prescription assistance
relation discovery
分类号
G353.1
[文化科学—情报学]