期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于FP序列树的法文词语提取方法研究 被引量:1
1
作者 于娟 吴晓鹏 +1 位作者 廖晓 刘建国 《电子科技大学学报》 EI CAS CSCD 北大核心 2021年第1期84-90,共7页
法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法... 法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法把文本中的单词共现信息压缩为FP序列树结构,快速提取频繁词串并计算其成词度,得到法文词语集合。实验表明,该方法的准确率高达90%,且具有比现有法文词语提取方法更高的召回率,能有效支持法语文本挖掘应用。 展开更多
关键词 FP序列树 法语文本挖掘 词语提取 成词度 文本压缩
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部