-
题名基于义类的无导词义消歧方法的研究
被引量:2
- 1
-
-
作者
全昌勤
何婷婷
姬东鸿
刘辉
-
机构
华中师范大学计算机科学与技术系
新加坡国家科技局信息科学研究院
华中师范大学生命科学学院
-
出处
《计算机应用研究》
CSCD
北大核心
2005年第4期39-41,共3页
-
基金
国家自然科学基金项目 ( 10071028 )
国家语言文字应用委员会语言文字应用"十五"科研项目
-
文摘
词义消歧在自然语言处理的许多应用领域都起着十分重要的作用。为了适用于大规模的词义消歧,提出了一种无导的学习方法。基于向量空间模型,结合机读词典和义类词典建立从义项到义类的映射关系,再利用义类知识在语料库中无导学习消歧特征,最后利用这些特征实现词义消歧。
-
关键词
自然语言处理
词义消歧
无导方法
义类
-
Keywords
Natural Language Processing
Word Sense Disambiguation
Unsupervised Method
Sense Categories
-
分类号
TP391.01
[自动化与计算机技术—计算机应用技术]
-
-
题名从搭配知识获取最优种子的词义消歧方法
被引量:13
- 2
-
-
作者
全昌勤
何婷婷
姬东鸿
刘辉
-
机构
华中师范大学计算机科学与技术系
新加坡国家科技局信息科学研究院
华中师范大学生命科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2005年第1期30-35,共6页
-
基金
国家自然科学基金资助项目 (10 0 710 2 8)
国家语言文字应用委员会语言文字应用"十五"科研项目
-
文摘
基于统计的词义消歧模型的一个关键问题是如何自动从语料库中获取指示词 ,虽然通过学习初始搭配实例能够在语料库中获取更多的搭配知识 ,但人工获取质量较好的初始搭配是比较困难的 ,并且无法保证有效的扩大搭配知识。针对该问题 ,提出了通过机器学习初始搭配实例获取最优种子 ,再由最优种子扩增更多指示词 ,最后利用这些指示词实现具有多个义项的多义词消歧。采用该方法对 8个多义词进行消歧的测试实验中取得了 87 7%的平均正确率。
-
关键词
人工智能
自然语言处理
自然语言处理
词义消歧
搭配
种子优选
-
Keywords
artificial intelligence
natural language processing
natural language processing
word sense disambiguation
collocation
select seeds
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于指示词的词义消歧方法
- 3
-
-
作者
全昌勤
何婷婷
姬东鸿
刘辉
-
机构
华中师范大学计算机科学与技术系
新加坡国家科技局信息科学研究院
华中师范大学生命科学学院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2005年第16期48-50,共3页
-
基金
国家自然科学基金资助项目(60442005
100710283)
国家语言文字应用委员会语言文字应用"十五"科研项目
-
文摘
影响词义消歧的特征是多方面的,为考察上下文指示词这一消歧特征,提出了利用统计的方法抽取指示词用于词义消歧。实验表明,该方法是可行的,并为利用多特征进行汉语自动消歧提供了可靠的参考。
-
关键词
自然语言处理
词义消歧
指示词
相似性
-
Keywords
Natural language processing
Word sense disambiguation
Indicators
Similarity
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-