-
题名基于专有名词优先的快速中文分词
被引量:5
- 1
-
-
作者
梁卓明
陈炬桦
-
机构
中山大学信息科学学院计算机系
-
出处
《计算机技术与发展》
2008年第3期24-27,共4页
-
文摘
中文分词是中文信息处理系统中的一个重要部分。主题信息检索系统对分词的速度和准确率有特殊的要求。文中回答了词库建立的词条来源和存储结构两大问题,提出了一种基于专有名词优先的快速中文分词方法:利用首字哈希、按字数分层存储、二分查找的机制,通过优先切分专有名词,将句子切分成碎片,再对碎片进行正反两次机械切分,最后通过快速有效的评价函数选出最佳结果并作调整。实验证明,该分词方法对主题信息文献的分词速度达92万字每秒,准确率为96%,表明该分词方法在主题信息文献的分词处理中具有较高性能。
-
关键词
中文分词
专有名词
词典机制
-
Keywords
Chinese word segmentation
special name
dictionary mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种面积守恒的曲线平滑
被引量:1
- 2
-
-
作者
林瑛
-
机构
中山大学信息科学学院计算机科学系
-
出处
《现代计算机》
2003年第6期77-78,95,共3页
-
文摘
传统意义上的曲线平滑是光滑曲线使之成为一段连续光滑的弧,但这是有收缩的。本文提出一种新的曲线平滑方法,这种方法不但具有传统平滑的效果,而且能使封闭曲线的面积在平滑后保持不变,因此这是无收缩的,从而更加合理。
-
关键词
曲线平滑
面积守恒
图像处理
计算机视觉
B样条函数
-
Keywords
Smoothing
Spline Smoothing
Radius
Reference Point
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-