期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于FP序列树的法文词语提取方法研究
被引量:
1
1
作者
于娟
吴晓鹏
+1 位作者
廖晓
刘建国
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2021年第1期84-90,共7页
法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法...
法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法把文本中的单词共现信息压缩为FP序列树结构,快速提取频繁词串并计算其成词度,得到法文词语集合。实验表明,该方法的准确率高达90%,且具有比现有法文词语提取方法更高的召回率,能有效支持法语文本挖掘应用。
展开更多
关键词
FP序列树
法语文本挖掘
词语提取
成词度
文本压缩
下载PDF
职称材料
题名
基于FP序列树的法文词语提取方法研究
被引量:
1
1
作者
于娟
吴晓鹏
廖晓
刘建国
机构
福州大学经济与管理学院
广东金融学院互联网金融与信息工程学院
上海财经大学会计与财务研究院
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2021年第1期84-90,共7页
基金
国家自然科学基金(71771054)。
文摘
法语复杂的语法和词形变化规则导致N-gram等词语提取方法的效果无法保证,影响法语文本挖掘的准确性。该文提出一种高效的法文词语提取方法,从待分析的法语文本中自动获取包括单词和短语的词语集合,构建法语文本挖掘所需的词库。该方法把文本中的单词共现信息压缩为FP序列树结构,快速提取频繁词串并计算其成词度,得到法文词语集合。实验表明,该方法的准确率高达90%,且具有比现有法文词语提取方法更高的召回率,能有效支持法语文本挖掘应用。
关键词
FP序列树
法语文本挖掘
词语提取
成词度
文本压缩
Keywords
FP sequence tree
French text mining
term extraction
termhood
text compression
分类号
TP182 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于FP序列树的法文词语提取方法研究
于娟
吴晓鹏
廖晓
刘建国
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部