用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用被引量：6

Restraining Template-matching with Logic and Discourse Structure: Application of the Knowledge of Logic and Discourse in Information Extraction

下载PDF

导出

摘要本文以文献[2]的语料为主要对象,讨论语句的逻辑结构和篇章结构怎样约束信息模板的类型,并约束对当前句中缺失的或以代词等形式表达的信息项目的求解。首先说明什么是基于论元结构的逻辑结构和篇章结构知识,然后分析否定算子、时体成分怎样改变事件的类型及其跟有关事件模板的匹配关系。接着,讨论动词的论元结构的内嵌和名词化等句法操作,怎样造成有关论元及相应的信息项目的分布位置发生变化。最后,讨论怎样利用篇章结构知识来求解本句中缺失的或以代词、指示词形式表达的信息项目。 This paper demonstrates how to use the knowledge of logic and discourse structure to restrain the template-matching in information extraction (briefly, IE), and to recover the missing information items or ones expressed by pronouns or deixis. It firstly explains what is the knowledge of the argument structure-based logic structure and discourse structure. Then it illustrates how the negative and aspect operators can change the type of event of a sentence and the matching relation between the sentence and the related event-template. And it shows how the embedding and nominalization of argument structure can change the syntactic position of some arguments and the related information items. Finally, it discusses how to use the knowledge of discourse structure to recover the missing information items or ones expressed by pronouns or deixis.

作者袁毓林

机构地区北京大学中文系

出处《中文信息学报》 CSCD 北大核心 2005年第4期39-45,共7页 Journal of Chinese Information Processing

基金教育部人文社会科学研究"十五"规划资助(01JB740006)

关键词计算机应用中文信息处理信息抽取论元结构逻辑结构篇章结构代词指示词 computer application Chinese information processing information extraction argument structure logic structure discourse structure pronoun deixis

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1吕叔湘.现代汉语八百词[M].北京:商务印书馆,2001..
2王建波,杜春玲,王开铸.基于篇章理解的自动文摘研究[J].中文信息学报,1995,9(3):33-42. 被引量：12
3袁毓林.信息抽取的语义知识资源研究[J].中文信息学报,2002,16(5):8-14. 被引量：18
4周明,黄昌宁.面向语料库标注的汉语依存体系的探讨[J].中文信息学报,1994,8(3):35-52. 被引量：40
5朱德熙.现代书面汉语里的虚化动词和名动词为第一届国际汉语教学讨论会而作[J].北京大学学报（哲学社会科学版）,1985,22(5):3-8. 被引量：133
6朱德熙.现代书面汉语里的虚化动词和名动词[J]..语法丛稿[M].上海:上海教育出版社,1990.114-124.

二级参考文献15

1顾阳.论元结构理论介绍[J].当代语言学,1994(1):1-11. 被引量：113
2袁毓林.流水句中否定的辖域及其警示标志[J].世界汉语教学,2000,14(3):22-33. 被引量：34
3朱德熙.汉语句法中的歧义现象[J].中国语文,1980,(2).
4孙斌.继承-归纳机制及其在对象系统中和信息提取技术中的应用，北京大学计算机系博士学位论文[M].,2000,6..
5黄昌宁，语言文字应用，1993年，2期
6张敏，硕士学位论文，1993年
7黄昌宁，1992年
8白栓虎，硕士学位论文，1992年
9吴升，硕士学位论文，1992年
10冯志伟，国外语言学，1983年，1期

共引文献208

1高逢亮,匡鹏飞.“V成”类形式动词及其词汇化[J].语言与翻译,2021(1):10-15.
2刘国兵,彭梦月.汉语轻动词构式“进行/加以+动词”的语料库研究[J].语料库语言学,2021(1):5-15. 被引量：1
3陆俭明.韵律语法研究小议[J].韵律语法研究,2020(1):1-15.
4张倩倩.基于语体语法的科学术语韵律构词分析[J].韵律语法研究,2019(2):188-208. 被引量：2
5吴吉煌.“从隐含到呈现”补说[J].民俗典籍文字研究,2020(1):233-246.
6匡鹏飞,高逢亮.论“展开”和“开展”[J].汉语学报,2020,0(1):43-50. 被引量：1
7张亮.“有待”的性质、功能及其演变[J].对外汉语研究,2021(2):170-183.
8高顺全,周玉品.“进行”构成的句式及其习得情况考察——从“进行”的语法化和句法语义属性谈起[J].对外汉语研究,2021(1):36-49.
9付晓歌.汉语动结式依存结构与特征结构对比分析[J].襄樊学院学报,2009,30(4):62-65.
10刘玉杰.现代汉语实词兼类的发展趋势[J].求是学刊,1993,20(2):81-85. 被引量：2

同被引文献163

1周强.汉语句法树库标注体系[J].中文信息学报,2004,18(4):1-8. 被引量：90
2徐赳赳,JonathanJ.Webster.复句研究与修辞结构理论[J].外语教学与研究,1999,31(4):16-22. 被引量：30
3张黎.汉语句子的语义结构[J].北方论丛,1995(5):54-60. 被引量：4
4于康.命题内成分与命题外成分——以汉语助动词为例[J].世界汉语教学,1996,10(1):27-34. 被引量：29
5贺胜.信息抽取技术内涵及应用[J].南京师范大学文学院学报,2004(2):184-188. 被引量：3
6李向阳,张亚非.基于语义标注的信息抽取[J].解放军理工大学学报（自然科学版）,2004,5(4):39-43. 被引量：12
7孟宪福,狄慧.基于Agent和XML的Web页面信息抽取研究与设计[J].计算机工程与设计,2004,25(8):1411-1414. 被引量：6
8程晓堂.从主位结构看英语作文的衔接与连贯[J].山东师大外国语学院学报,2002(2):94-98. 被引量：44
9侯敏,孙建军.汉语中的零形回指及其在汉英机器翻译中的处理对策[J].中文信息学报,2005,19(1):14-20. 被引量：23
10梅立军,周强,臧路,陈祖舜.知网与同义词词林的信息融合研究[J].中文信息学报,2005,19(1):63-70. 被引量：28

引证文献6

1罗进军.当前计算语言学研究的发展态势[J].湖南工业职业技术学院学报,2006,6(4):105-107.
2郑彦宁,化柏林,张新民.信息检索与信息抽取差异性探析[J].图书情报工作,2007,51(10):17-20. 被引量：1
3丁堃,刘盛博,许侃.基于文本挖掘机制的区域经济关系分析[J].情报学报,2008,27(3):418-424. 被引量：5
4徐凡,朱巧明,周国栋.篇章分析技术综述[J].中文信息学报,2013,27(3):20-32. 被引量：15
5徐凡,朱巧明,周国栋,王明文.衔接性驱动的篇章一致性建模研究[J].中文信息学报,2014,28(3):11-21. 被引量：1
6张坤丽,韩英杰,贾玉祥,穆玲玲,穗志方,昝红英.汉语逻辑补足义标注框架研究[J].中文信息学报,2019,33(2):8-16.

二级引证文献22

1鲁超,刘清.结合地理信息的引文分析研究现状[J].情报科学,2011,29(2):303-307. 被引量：3
2郭金龙,许鑫,陆宇杰.人文社会科学研究中文本挖掘技术应用进展[J].图书情报工作,2012,56(8):10-17. 被引量：23
3蒋艳辉,姚靠华,周双文,王薇.一种基于领域本体的药品研发信息抽取方法[J].情报杂志,2012,31(12):130-134. 被引量：4
4龚光明,王薇,蒋艳辉,周双文.基于领域本体的文本资料聚类算法改进研究[J].情报科学,2013,31(6):129-134. 被引量：3
5孙成,孔芳.基于转移的中文篇章结构解析研究[J].中文信息学报,2018,32(12):48-56. 被引量：5
6徐凡,朱巧明,周国栋,王明文.衔接性驱动的篇章一致性建模研究[J].中文信息学报,2014,28(3):11-21. 被引量：1
7汪蓉,李寿山,李生,周国栋.基于特征提取的连接词识别方法[J].山西大学学报（自然科学版）,2014,37(4):564-569.
8郭喜跃,何婷婷.信息抽取研究综述[J].计算机科学,2015,42(2):14-17. 被引量：86
9王荣波,李杰,黄孝喜,周昌乐,谌志群,王小华.基于多元判别分析的汉语句群自动划分方法[J].计算机应用,2015,35(5):1314-1319. 被引量：4
10沙勇忠,陆莉.语段结构方法在社会媒体信息处理中的应用[J].图书情报工作,2015,59(12):120-127.

1全昌勤,何婷婷,姬东鸿,刘辉.基于指示词的词义消歧方法[J].计算机工程,2005,31(16):48-50.
2袁毓林.信息抽取的语义知识资源研究[J].中文信息学报,2002,16(5):8-14. 被引量：18
3袁毓林.用动词的论元结构跟事件模板相匹配——一种由动词驱动的信息抽取方法[J].中文信息学报,2005,19(5):37-43. 被引量：22
4章顺瑞,骆陈.基于语义角色分析的事件抽取技术[J].太赫兹科学与电子信息学报,2017,15(2):279-284. 被引量：3
5范冬梅,卢志茂,张汝波.面向词义消歧的指示词扩展技术[J].计算机工程与应用,2010,46(15):10-12. 被引量：1
6汤小娜,苏劲松.贝叶斯分类在词义消歧中的分析[J].黑龙江科技信息,2007(04S):38-38.
7娘本先,安见才让.藏文人名自动识别研究[J].电子技术与软件工程,2015(19):115-116. 被引量：2
8秦兵,刘安安,刘挺.无指导的中文开放式实体关系抽取[J].计算机研究与发展,2015,52(5):1029-1035. 被引量：48
9程节华,戴新宇,陈家骏,王启祥.汉英机器翻译中时体态处理[J].计算机应用研究,2004,21(3):79-80. 被引量：11
10赵鸣,王细洋.基于模型定义的飞机结构件数控编程方法[J].机械设计与制造工程,2014,43(2):13-17. 被引量：1

中文信息学报

2005年第4期

浏览历史

内容加载中请稍等...

用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用被引量：6

参考文献6

二级参考文献15

共引文献208

同被引文献163

引证文献6

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用 被引量：6

参考文献6

二级参考文献15

共引文献208

同被引文献163

引证文献6

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用被引量：6