基于《知网》的中文信息结构抽取研究被引量：4

An Approach Based HowNet for Extracting Chinese Message Structure

下载PDF

导出

摘要文章提出了一种在真实文本中抽取中文信息结构的方法—利用大规模基于语义依存关系的语料库对《知网》的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语。该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景。 An approach of extracting Chinese Message Structure from real texts is presented in this paper.The authors used the annotated corpus based on semantic dependent relations for Chinese Message Structure patterns' training.With those patterns as rules,they built a partial dependency parser,so as to extract CMS from real texts as most as possible.The description of the training algorithm,experimental results and some conclusion are given.

作者尤昉李涓子王作英

机构地区清华大学电子工程系清华大学计算机科学与技术系

出处《计算机工程与应用》 CSCD 北大核心 2002年第18期56-58,共3页 Computer Engineering and Applications

基金国家863高技术研究发展计划项目(编号:863-306-ZD03-02-1) 985重大项目"人机自然语言交互技术"(编号:985校-22-攻关-06)资助

关键词《知网》中文信息结构部分依存分析器中文信息处理信息抽取 HowNet,Chinese Message Structure(CMS ),partial dependency parser,rule

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1李涓子.基于语义依存关系的汉语理解语言模型研究：博士后出站报告[M].北京:清华大学电子工程系,2001..
2张建平.大词汇量连续语音识别中的语言模型和理解算法的研究：博士学位论文[M].北京:清华大学电子工程系,1999..

同被引文献24

1刘亚军,徐易.一种基于加权语义相似度模型的自动问答系统[J].东南大学学报（自然科学版）,2004,34(5):609-612. 被引量：36
2张亮,冯冲,陈肇雄,黄河燕.基于语句相似度计算的FAQ自动回复系统设计与实现[J].小型微型计算机系统,2006,27(4):720-723. 被引量：19
3董振东,董强,郝长伶.知网的理论发现[J].中文信息学报,2007,21(4):3-9. 被引量：99
4董振东董强.关于知网-中文信息结构库[EB/OL].http://www.keenage.com,.
5The LTAG Research Group. A Lexical Tree Adjoining Grammar for English. Institute for Research in Cognitive Science, Univ. of Pennsylvania, 1998.
6董振东.关于《知网》的动态角色与属性[R]:内部报告[R].,2001..
7Xia Fei, Palmer M, Vijay-Shanker K, et al. Consistent Grammar Development Using Partial-tree Descriptions for Lexicalized Tree Adjoining Grammars. In Fourth International Workshop on Tree Adjoining Grammars and Related Frameworks. 1998:180-183.
8Xue Nianwen, Xia Fei. The Bracketing Guidelines for the Penn Chinese Treebank. Technical Report IRCS 00-08, University of Pennsylvania,Philadelphia, PA, 2000.
9中国互联网信息中心.第14次中国互联网络发展状况调查统计报告[R].http://www.cnnic.net.cn/ download/2004/2004072002.pdf,2004-07.
10中国互联网信息中心.2003年中国互联网络信息资源数量调查报告[R].http://www.cnnic.net.cn/ download/ manual/report20030330.doc:60.

引证文献4

1许云,樊孝忠,张锋.基于《知网》信息结构模式的词汇化树邻接文法消歧[J].计算机工程,2005,31(13):4-6. 被引量：1
2曹二堂,刘玉林.一种基于语义理解的元搜索引擎的研究[J].计算机工程,2006,32(7):210-211. 被引量：8
3陈林,杨丹,赵俊芹.基于语义理解的智能搜索引擎研究[J].计算机科学,2008,35(6):152-154. 被引量：13
4赵杰,李卫华.基于知网的矛盾问题语义二义性研究[J].广东工业大学学报,2014,31(2):21-26. 被引量：4

二级引证文献25

1孟庆国,王友奎,田红红.政务服务中的智能化搜索:特征、应用场景和运行机理[J].电子政务,2020,0(2):21-33. 被引量：22
2王春云,秦杰,胡双双.基于本体的元搜索引擎技术研究[J].计算机系统应用,2008,17(10):96-98.
3陈蓉芳,郑晓波,王占朝,王海滨,董秀成.基于“会诊式”推理控制策略的智能型搜索引擎的研究[J].安装,2007(1):43-46. 被引量：1
4孙卫喜.搜索引擎分析[J].高校实验室工作研究,2007(3):49-52. 被引量：1
5种梅,刘方爱.元搜索引擎中的成员选择和结果合并策略研究[J].计算机工程与设计,2007,28(21):5125-5127. 被引量：5
6王春云,秦杰,胡双双.基于本体的元搜索引擎技术研究[J].微型电脑应用,2008,24(9):8-9. 被引量：1
7李爱军,王海滨,郑晓波.基于推理控制策略的智能型电力搜索引擎的研究[J].西华大学学报（自然科学版）,2008,27(6):34-37. 被引量：2
8田占霄,韩宪忠,王克俭.一种改进的长词优先逆向最大匹配分词消歧策略[J].河北农业大学学报,2009,32(4):100-102. 被引量：1
9孙素芬,罗长寿,魏清凤.Web农业实用技术自动问答系统设计实现[J].现代图书情报技术,2009(7):70-74. 被引量：5
10陈文君,於文雪.汉英跨语言检索系统中关键词提取方法的研究[J].电脑知识与技术,2009,5(10):7848-7849.

1张瑞霞,庄晋林,杨国增.基于《知网》的中文信息结构消歧研究[J].中文信息学报,2012,26(4):43-49. 被引量：6
2郭威.基于Web应用结构抽取技术研究[J].信息与电脑（理论版）,2011(9):113-115.
3王亮.基于XML异构数据库数据转换技术的研究[J].信息安全与技术,2012,3(8):77-79. 被引量：1
4张瑞霞,杨国增,闫新庆.基于知网的汉语普通未登录词语义分析模型[J].计算机应用与软件,2012,29(8):126-130. 被引量：4
5刘继红,吴军华,任明鑫.基于改进的网络蜘蛛算法抽取Web站点结构的方法[J].江南大学学报（自然科学版）,2009,8(5):555-559. 被引量：5
6肖升.本体视图特征项提取算法及其在智能检索中的应用[J].图书情报工作,2010,54(10):114-116.
7孙霞,程宏斌.基于加权层次结构的XML文档相似度算法[J].武汉理工大学学报,2009,31(18):76-79. 被引量：1
8冯雁,王申康.Web站点层次结构抽取算法的分析和实现[J].浙江大学学报（工学版）,2005,39(10):1507-1511. 被引量：3
9卢晓蓉,陈传波,李兵.基于XML的多数据库系统集成数据模型[J].华中科技大学学报（自然科学版）,2002,30(8):18-20. 被引量：3
10李辉,赵海,郝立颖,何滨.基于k-核的大规模软件核心框架结构抽取与度量[J].东北大学学报（自然科学版）,2011,32(7):939-943. 被引量：2

计算机工程与应用

2002年第18期

浏览历史

内容加载中请稍等...

基于《知网》的中文信息结构抽取研究被引量：4

参考文献2

同被引文献24

引证文献4

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于《知网》的中文信息结构抽取研究 被引量：4

参考文献2

同被引文献24

引证文献4

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于《知网》的中文信息结构抽取研究被引量：4