多重复句关系标记搭配的求解模型研究被引量：4

Research on a Solving Model of the Collocations Between the Relation Markers in Multiple Compound Sentences

下载PDF

导出

摘要关系词是多重复句的连接成分,其功能是关联分句且标志分句间的语义关系,它对多重复句的研究具有重要意义。但是,在研究基于规则的现代汉语复句关系词的自动标识过程中,发现多重复句内初次识别出的关系标记,较多是伪关系词。这就需要判定其是否是真正的关系词,而判定的基础是确定关系标记之间的搭配关系,这是一个难点。为解决该问题,本文提出了两个算法:(1)利用解空间树得到关系标记所有的搭配集合;(2)对解空间树进行剪枝,去掉无用搭配集。实验测试可知:这两个算法不仅通用性强,而且判定正确率达到98.9%,剩下的1.1%还可以得到近似解,这表明本文提出的算法在处理多重复句问题上具有较好的可行性。 Relation words are the connected components of compound sentences, and the function of them is mainly associating clauses and marking the sense relations between clauses, but in the process of studying the automatic identification of the relation words of Modern Chinese compound sentences based on rules, we find that most of the relation markers identified in multiple compound sentences are fake relation words. Therefore, it is needed to determine whether a relation word is true, and the basis for determination is confirming the collocations between relation markers, yet it is a difficulty. This paper proposes two algorithms to solve this problem：（1）utilizing the resolution space tree to get all the collocations between relation markers; （2）pruning the solution space tree in order to delete the useless set of collocations. The results of experiments show that the two algorithms not only are general-purpose, but also the accuracy can be improved to 98. 9 % and the remaining 1. 1% can get app which shows the good effectiveness in dealing with the issues of multiple compound roximate solutions, sentences.

作者胡金柱雷利利杨进才舒江波陈江曼

机构地区华中师范大学计算机科学系华中师范大学语言与语言教育研究中心华中师范大学国家数字化学习工程技术研究中心

出处《计算机工程与科学》 CSCD 北大核心 2011年第11期177-182,共6页 Computer Engineering & Science

基金国家教育部人文社科重点研究基地重点项目(10JJD740012) 2011年国家社科基金资助项目(11BYY052)

关键词多重复句关系词搭配解空间树 multiple compound sentences the collocations between relation words the resolution space tree

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1肖升,胡金柱,姚双云,吴锋文.关系词搭配的联列分析[J].宁夏大学学报（人文社会科学版）,2009,31(6):75-79. 被引量：2
2刑福义.汉语语法学[M].长春:东北师范大学出版社,2000.
3胡金柱,舒江波,罗进军.汉语复句中分句的语义关联特征[J].语言文字应用,2010(4):121-130. 被引量：8
4胡金柱,吴锋文,李琼,舒江波.汉语复句关系词库的建设及其利用[J].语言科学,2010,9(2):133-142. 被引量：31
5胡金柱,舒江波,姚双云,周星,吴锋文,肖升.面向中文信息处理的复句关系词提取算法研究[J].计算机工程与科学,2009,31(10):90-93. 被引量：22
6姚双云.复句关系标记的搭配研究[M].武汉:华中师范大学,2010.
7沈威,姚双云.基于规则的复句中的关系词标注探讨[J].福建电脑,2007,23(4):6-7. 被引量：7

二级参考文献24

1姚双云.小句中枢理论的应用与复句信息工程[J].汉语学报,2005(4):71-79. 被引量：17
2俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量：29
3王荣波,池哲儒.基于词类串的汉语句子结构相似度计算方法[J].中文信息学报,2005,19(1):21-29. 被引量：28
4卫乃兴.基于语料库和语料库驱动的词语搭配研究[J].当代语言学,2002,4(2):101-114. 被引量：240
5张锋,许云,侯艳,樊孝忠.基于互信息的中文术语抽取系统[J].计算机应用研究,2005,22(5):72-73. 被引量：36
6罗进军,尹蔚.面向复句信息处理的小句关联理论[J].湘潭师范学院学报（社会科学版）,2006,28(6):129-132. 被引量：7
7马清华.关联标记的结构控制作用[J].汉语学习,2006(6):11-18. 被引量：7
8沈威,姚双云.基于规则的复句中的关系词标注探讨[J].福建电脑,2007,23(4):6-7. 被引量：7
9孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳.利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J].计算机研究与发展,1997,34(5):332-339. 被引量：66
10邢福义.汉语语法学[M].长春:东北师范大学出版社,2000.75-78.

共引文献50

1孙凯丽,邓沌华,李源,李妙,李洋.基于句内注意力机制多路CNN的汉语复句关系识别方法[J].中文信息学报,2020(6):9-17. 被引量：10
2李敏.“十五”以来汉语复句研究的新进展[J].鲁东大学学报（哲学社会科学版）,2008,25(3):72-77. 被引量：2
3罗进军.基于句法识别的有标复句层次关系研究[J].汉语学报,2009(1):83-89. 被引量：10
4胡金柱,吴锋文,李琼,舒江波.汉语复句关系词库的建设及其利用[J].语言科学,2010,9(2):133-142. 被引量：31
5胡金柱,舒江波,罗进军.汉语复句中分句的语义关联特征[J].语言文字应用,2010(4):121-130. 被引量：8
6吴锋文.基于主谓语知识挖掘的分句语义关联研究[J].语言文字应用,2011(4):132-142. 被引量：8
7吴锋文.面向信息处理的“一标三句式”复句层次关系判定[J].北方论丛,2012(1):64-68. 被引量：11
8吴锋文.面向信息处理的“二标三句式”复句层次关系判定[J].信阳师范学院学报（哲学社会科学版）,2012,32(1):88-93. 被引量：10
9姚双云,胡金柱,舒江波,沈威.篇章连贯语义关系的自动标注方法[J].计算机工程,2012,38(7):131-133. 被引量：5
10龚贺.连贯关系标记“然后”和“后来”的差异[J].时代教育,2012(7):289-290.

同被引文献60

1姚双云.小句中枢理论的应用与复句信息工程[J].汉语学报,2005(4):71-79. 被引量：17
2陆俭明.关于句处理中所要考虑的语义问题[J].语言研究,2001,21(1):1-12. 被引量：24
3王立霞,孙宏林.现代汉语介词短语边界识别研究[J].中文信息学报,2005,19(3):80-86. 被引量：11
4张仕仁.汉语复句的结构分析[J].中文信息学报,1994,8(4):43-54. 被引量：13
5张金,王军海,耿标.基于规则解析的柔性编码系统[J].计算机系统应用,2006,15(3):17-20. 被引量：2
6李幸,宗成庆.引入标点处理的层次化汉语长句句法分析方法[J].中文信息学报,2006,20(4):8-15. 被引量：22
7沈威,姚双云.基于规则的复句中的关系词标注探讨[J].福建电脑,2007,23(4):6-7. 被引量：7
8杜超华,胡金柱,沈威,姚双云.基于复句语料库分词系统研究[J].计算机与数字工程,2007,35(5):43-44. 被引量：6
9吴锋文.基于关系标记的汉语复句分类研究.汉语学报,2011,(3):63-73.
10胡金柱,沈威,杜超华,姚双云,罗进军.基于渡越矩阵的复句关系词自动标注初探[J].微计算机信息,2007,23(30):200-202.

引证文献4

1吴锋文.面向信息处理的汉语复句研究现状及其展望[J].宁夏大学学报（人文社会科学版）,2013,35(4):29-33.
2杨进才,谢芳,胡金柱.汉语复句关系词自动标识中规则引擎的研究[J].计算机科学,2014,41(B11):25-28. 被引量：3
3吴锋文.汉语复句信息处理研究二十年[J].中文信息学报,2015,29(1):13-18. 被引量：4
4贾遂民,雷利利,胡明生.基于规则的复句关系词的自动标识[J].中文信息学报,2015,29(1):44-48. 被引量：4

二级引证文献9

1孙凯丽,邓沌华,李源,李妙,李洋.基于句内注意力机制多路CNN的汉语复句关系识别方法[J].中文信息学报,2020(6):9-17. 被引量：10
2吴锋文.基于模式识别的四句式复句句法语义关系判定[J].汉语学报,2017(3):17-26. 被引量：4
3杨进才,陈忠忠,沈显君,胡金柱.二句式非充盈态有标复句关系类别的自动标志[J].计算机应用研究,2017,34(10):2950-2953. 被引量：9
4安帅飞,毕玉德,张婷.韩国语定语从句句法特征分析及其自动识别[J].中文信息学报,2018,32(2):66-74. 被引量：2
5杨进才,涂馨丹,沈显君,胡金柱.基于依存关系规则的汉语复句关系词自动识别[J].计算机应用研究,2018,35(6):1756-1760. 被引量：9
6李源,刘凤娇,刘剑锋,翟宏森,杨梦川.基于标记隐现规则的复句层次关系识别——三句式二重有标复句层次关系识别[J].计算机与数字工程,2018,46(4):750-753.
7杨进才,郑雷,胡泉.基于语义依存关系的汉语复句关系词自动识别[J].计算机与数字工程,2021,49(8):1531-1537. 被引量：4
8杨进才,胡巧玲,胡泉.基于规则的有标复句关系的自动识别[J].计算机科学,2021,48(S02):124-129. 被引量：1
9吴锋文,周龙豪.依存理论视域下的汉语复杂事件句研究热点与趋势——基于CiteSpace文献计量分析[J].信阳师范学院学报（哲学社会科学版）,2024,44(1):127-133.

1胡金柱,陈江曼,杨进才,舒江波,雷利利.基于规则的连用关系标记的自动标识研究[J].计算机科学,2012,39(7):190-194. 被引量：15
2林华东.也谈多重复句的分析——评《多重复句的分析模型》[J].泉州师范学院学报,1992(2):39-43.
3李慧鹏.基于CAN总线的分布式多轴运动控制系统[J].科技创新与应用,2012,2(9):14-14.
4胡泉,谢芳,李源,刘延申.基于复杂网络理论的汉语复句关系词搭配网的统计特征研究[J].中文信息学报,2016,30(4):56-64. 被引量：1
5李源,刁胜权,汪春红,郑印,刘凤娇.基于搭配关系的有标复句层次关系分析[J].计算机与数字工程,2016,44(4):683-686. 被引量：2
6肖升,胡金柱,姚双云,吴锋文.搭配关系的P／T网建模[J].中南林业科技大学学报,2009,29(1):101-105. 被引量：1
7胡泉,刘延申,谢芳,邓君丽.汉语复句关系词搭配网中的小世界效应和无标度特征[J].武汉大学学报（工学版）,2014,47(6):859-864. 被引量：3
8肖升,胡金柱,姚双云,吴锋文.面向对象有标复句本体建模[J].计算机应用研究,2010,27(2):552-554. 被引量：6
9海涛,鲍远律.基于区域特征和连接成分的地图规范化算法[J].计算机技术与发展,2007,17(10):137-140. 被引量：2
10李成.2D科学数据可视化处理的研究[J].电脑知识与技术（过刊）,2010,0(14):3736-3738. 被引量：1

计算机工程与科学

2011年第11期

浏览历史

内容加载中请稍等...

多重复句关系标记搭配的求解模型研究被引量：4

参考文献7

二级参考文献24

共引文献50

同被引文献60

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

多重复句关系标记搭配的求解模型研究 被引量：4

参考文献7

二级参考文献24

共引文献50

同被引文献60

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

多重复句关系标记搭配的求解模型研究被引量：4