-
题名基于《知网》的中文信息结构消歧研究
被引量:6
- 1
-
-
作者
张瑞霞
庄晋林
杨国增
-
机构
华北水利水电学院信息工程学院
郑州师范学院数学系
-
出处
《中文信息学报》
CSCD
北大核心
2012年第4期43-49,60,共8页
-
基金
河南省科技厅基础研究项目(082300410140)
-
文摘
《中文信息结构库》是《知网》的重要组成部分之一,可以作为中文语义分析的规则库,对其进行消歧是实际应用的基础之一。因此,该文首先对中文信息结构进行了形式化描述;接着对其进行优先级划分;然后根据其构成形式提出了四种不同的消歧方法:即词性序列消歧法、图相容匹配消歧法、图相容度计算消歧法、基于实例的语义相似度计算消歧法;最后针对不同优先级的中文信息结构集设计了不同消歧流程。实验结果证明消歧正确率达到了90%以上。
-
关键词
知网
中文信息结构
消歧
图相容度
语义相似度
-
Keywords
HowNet
Chinese message structure
disambiguation
graph compatibility
semantic similarity
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于《知网》的中文信息结构抽取研究
被引量:4
- 2
-
-
作者
尤昉
李涓子
王作英
-
机构
清华大学电子工程系
清华大学计算机科学与技术系
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第18期56-58,共3页
-
基金
国家863高技术研究发展计划项目(编号:863-306-ZD03-02-1)
985重大项目"人机自然语言交互技术"(编号:985校-22-攻关-06)资助
-
文摘
文章提出了一种在真实文本中抽取中文信息结构的方法—利用大规模基于语义依存关系的语料库对《知网》的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语。该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景。
-
关键词
《知网》
中文信息结构
部分依存分析器
中文信息处理
信息抽取
-
Keywords
HowNet,Chinese Message Structure(CMS ),partial dependency parser,rule
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名《面向中文信息处理的现代汉语短语结构规则研究》序
被引量:4
- 3
-
-
作者
陆俭明
-
机构
北京大学中文系
-
出处
《汉语学习》
2000年第5期70-72,共3页
-
-
关键词
《面向中文信息处理的现代汉语短语结构规则研究》
中文信息处理
机器翻译系统
句处理
汉语学习
-
分类号
G256.4
[文化科学—图书馆学]
H085
[语言文字—语言学]
-
-
题名基于概念扩充的新闻信息抽取模型
- 4
-
-
作者
谷文
王迪
王红梅
-
机构
长春工业大学计算机科学与工程学院
-
出处
《计算机与信息技术》
2009年第12期47-49,共3页
-
文摘
在Web信息日益增多的情况下,为了提高新闻浏览的效率,本文提出了基于概念的中文Web新闻信息抽取。其主要思想是:对Web新闻信息进行中文语块的抽取,得到文本的语法语义,然后根据用户提出的语义模板和概括扩充的理论,对模板进行概念扩充,最后根据抽取的中文语块填充模板,形成结构化的数据库,供用户检索。
-
关键词
概念扩充
信息抽取
语块
语义模板
中文信息结构库
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-