期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
数字政府政策央地协同量化研究——基于三维分析框架的文本分析
1
作者
陈美
聂佳睿
《情报理论与实践》
CSSCI
北大核心
2024年第10期82-93,150,共13页
[目的/意义]数字政府建设是政府改革的重要驱动力之一,央地数字政府政策形成良好的协同状态可以最大化发挥数字政府建设转变政府职能、打破信息壁垒等作用。通过对数字政府政策央地协同状况的量化研究,可以厘清央地数字政府政策目标瞄...
[目的/意义]数字政府建设是政府改革的重要驱动力之一,央地数字政府政策形成良好的协同状态可以最大化发挥数字政府建设转变政府职能、打破信息壁垒等作用。通过对数字政府政策央地协同状况的量化研究,可以厘清央地数字政府政策目标瞄准、文本创新与施行成效现状。[方法/过程]以2019—2023年央地336项数字政府政策为研究样本,利用LDA主题建模法、Doc2Vec、PMC指数分析法建立“主题响应度—文本相似度—成效协同度”三维分析框架,进行数字政府政策央地协同状况量化研究。[结果/结论]央地现有数字政府政策数量较多,但省份间、地区间存在较大差异,央地政策主题协同效果良好,政策文本承继与创新呈现平衡状态,部分省份政策成效需要进一步加强,以促进央地政策良性耦合与扩散发展。
展开更多
关键词
数字政府
央地协同
政策文本
LDA主题模型
doc2vec
PMC指数模型
原文传递
基于LDA模型和Doc2vec的学术摘要聚类方法
被引量:
21
2
作者
张卫卫
胡亚琦
+1 位作者
翟广宇
刘志鹏
《计算机工程与应用》
CSCD
北大核心
2020年第6期180-185,共6页
针对特定任务下的短文本聚类已经成为文本数据挖掘的一项重要任务。学术摘要文本由于数据稀疏造成了聚类结果准确率低、语义鸿沟问题,狭窄的域导致大量无关紧要的单词重叠,使得很难区分主题和细粒度集群。鉴于此,提出一种新的聚类模型...
针对特定任务下的短文本聚类已经成为文本数据挖掘的一项重要任务。学术摘要文本由于数据稀疏造成了聚类结果准确率低、语义鸿沟问题,狭窄的域导致大量无关紧要的单词重叠,使得很难区分主题和细粒度集群。鉴于此,提出一种新的聚类模型——主题句向量模型(Doc2vec-LDA,Doc-LDA),该模型通过将LDA主题模型(Latent Dirichlet Allocation)和句向量模型融合(Doc2vec),不仅使得在模型训练过程中既能利用整个语料库的信息,而且还利用Paragraph Vector的局部语义空间信息完善LDA的隐性语义信息。实验采用爬取到的知网摘要文本作为数据集,选用K-Means聚类算法对各模型的摘要文本进行效果比较。实验结果表明,基于Doc-LDA模型的聚类效果优于LDA、Word2vec、LDA+Word2vec模型。
展开更多
关键词
短文本聚类
LDA模型
doc2vec
模型
学术摘要
下载PDF
职称材料
基于Doc2Vec与SVM的聊天内容过滤
被引量:
5
3
作者
岳文应
《计算机系统应用》
2018年第7期127-132,共6页
直播系统中用户聊天内容的实时拦截具有非常重大的意义,为了提高分类的准确率和效率,提出了一种基于Doc2Vec与SVM结合的文本分类模型对聊天内容分类,判断聊天内容是否应该被拦截.首先使用Doc2Vec模型将聊天内容表示成密集数值向量的形式...
直播系统中用户聊天内容的实时拦截具有非常重大的意义,为了提高分类的准确率和效率,提出了一种基于Doc2Vec与SVM结合的文本分类模型对聊天内容分类,判断聊天内容是否应该被拦截.首先使用Doc2Vec模型将聊天内容表示成密集数值向量的形式,第二部分使用SVM分类器进行分类.通过实验表明,该模型有效地减少了文本表示的维度,提高了训练效率,而且具有的97%的准确率和89.82%召回率,性能优于朴素贝叶斯和基于Doc2Vec的Logistic模型.
展开更多
关键词
文本分类
自然语言处理
doc2vec
模型
支持向量机
下载PDF
职称材料
融合LDA主题和Doc2vec算法的DeepFM模型的推荐算法研究
被引量:
3
4
作者
刘伦珲
吴丽萍
《电视技术》
2022年第4期47-53,共7页
如今,有很多辅助决策算法在日常生活的各个方面为人们推荐个性化内容或产品。本文以医疗信息推荐作为案例,研究提出一种融合狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型和Doc2vec算法的DeepFM模型。该模型能够挖掘评论文本...
如今,有很多辅助决策算法在日常生活的各个方面为人们推荐个性化内容或产品。本文以医疗信息推荐作为案例,研究提出一种融合狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型和Doc2vec算法的DeepFM模型。该模型能够挖掘评论文本中的隐藏主题和隐藏特征并考虑隐藏特征的交叉情况,能够在保留评论文本表层信息的同时学习数据中的浅层和深层特征。本文将该模型与之前的模型在真实的数据上进行实验对比。实验结果表明,相较于现存模型,该模型的推荐准确率有了一定的提高。
展开更多
关键词
推荐系统
LDA主题模型
doc2vec
DeepFM
下载PDF
职称材料
基于文本融合特征的突发事件子话题聚类研究
5
作者
芦子涵
郑中团
《智能计算机与应用》
2023年第10期45-51,55,共8页
突发事件具有突发性、公共性、传播范围广等特点,研究同一突发事件中更细粒度的子话题聚类,对舆情管控部门实现精准化管控具有重要意义。针对以往话题聚类方法忽略了同一事件下更细粒度的子话题聚类,且为了更有效地表达微博文本的语义信...
突发事件具有突发性、公共性、传播范围广等特点,研究同一突发事件中更细粒度的子话题聚类,对舆情管控部门实现精准化管控具有重要意义。针对以往话题聚类方法忽略了同一事件下更细粒度的子话题聚类,且为了更有效地表达微博文本的语义信息,提出一种基于LDA文档-主题分布与Doc2Vec句向量融合的文本特征表示方法与文本相似度计算方法,应用Single-Pass增量聚类算法实现同一突发事件下子话题聚类,并根据F1值与单一文本特征子话题聚类实验结果进行对比。结果表明,本文方法子话题聚类效果更佳,F1值为72.4%,表明该方法能够有效地表达文本特征,进而提高子话题聚类的准确度。
展开更多
关键词
突发事件
子话题聚类
文本特征
LDA主题模型
doc2vec
模型
下载PDF
职称材料
基于多源文本挖掘的技术演化路径识别
被引量:
9
6
作者
刘怀兰
刘盛
+1 位作者
周源
张睿
《情报理论与实践》
CSSCI
北大核心
2022年第11期178-187,共10页
[目的/意义]提出一种基于文档向量化和自动化短语挖掘的改进主题建模方法(Doc2Vec-KMeans++-TopMine,DKT),从多维视角识别领域内的技术演化路径,展示领域内技术的发展与现状。[方法/过程]获取研究领域内的论文、专利、产品等多源数据,...
[目的/意义]提出一种基于文档向量化和自动化短语挖掘的改进主题建模方法(Doc2Vec-KMeans++-TopMine,DKT),从多维视角识别领域内的技术演化路径,展示领域内技术的发展与现状。[方法/过程]获取研究领域内的论文、专利、产品等多源数据,综合采用文档向量化、聚类算法和短语挖掘算法,完成领域多源数据的融合主题挖掘,通过语义相似度计算进行多源融合主题的关联与演化路径的识别,采用“主题河流图”可视化方法绘制多维度技术演化路径,从前沿研究、技术研发、市场应用等多维度视角出发开展领域演化分析。[结果/结论]选取数控机床领域进行实证研究,实验结果表明,利用DKT方法挖掘到的演化路径信息丰富,可以进行多维技术演化路径分析,并证明了其有效性,同时还得到了多个维度视角下的领域发展过程,发现了数控机床领域的3种技术演化模式。
展开更多
关键词
技术演化路径
多源数据
主题建模
文本挖掘
doc2vec
TopMine
原文传递
基于改进TextRank算法的中文文本摘要提取
被引量:
24
7
作者
徐馨韬
柴小丽
+2 位作者
谢彬
沈晨
王敬平
《计算机工程》
CAS
CSCD
北大核心
2019年第3期273-277,共5页
为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重...
为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重影响因子的TextRank算法对文本语句进行排序,并提取主题句生成摘要。实验结果表明,DK-TextRank算法在摘要语句数量为7时F值达到79.36%,相比传统TF-IDF、TextRank算法提取的摘要质量更高。
展开更多
关键词
doc2vec
模型
K-MEANS算法
TextRank算法
摘要提取
权重影响因子
下载PDF
职称材料
融合文本分布式表示的重复缺陷报告检测
被引量:
2
8
作者
曾杰
贲可荣
+1 位作者
张献
徐永士
《计算机工程与科学》
CSCD
北大核心
2021年第4期670-680,共11页
重复缺陷报告检测能够避免对描述同一缺陷的多份报告进行重复的任务分派和修复,可降低软件维护成本。为了进一步提高检测的准确率,提出一种融合文本分布式表示的重复缺陷报告检测方法。首先,基于大规模缺陷报告数据库训练Doc2Vec模型并...
重复缺陷报告检测能够避免对描述同一缺陷的多份报告进行重复的任务分派和修复,可降低软件维护成本。为了进一步提高检测的准确率,提出一种融合文本分布式表示的重复缺陷报告检测方法。首先,基于大规模缺陷报告数据库训练Doc2Vec模型并抽取缺陷报告的分布式表示,将不同长度的缺陷报告编码为统一长度的稠密向量。接着,通过比较这些向量来计算不同缺陷报告的相似程度,将其作为一种新特征与重复缺陷报告检测过程常用的其它特征进行融合,并利用机器学习算法训练二元分类模型。在公开的Bugzilla重复缺陷报告数据集上的实验结果表明,相比于代表性方法D_TS,本文方法的F1值平均提升了2%,说明了新特征的有效性。
展开更多
关键词
重复缺陷报告
文本分布式表示
doc2vec
模型
机器学习算法
下载PDF
职称材料
题名
数字政府政策央地协同量化研究——基于三维分析框架的文本分析
1
作者
陈美
聂佳睿
机构
中南财经政法大学公共管理学院
出处
《情报理论与实践》
CSSCI
北大核心
2024年第10期82-93,150,共13页
基金
国家自然科学基金项目“公共数据开放利用的效果评估、影响因素与支撑研究”(项目编号:72474228)
国家自然科学基金项目“面向用户的开放政府数据使用行为机理及隐私风险控制研究”(项目编号:72004056)
+1 种基金
中南财经政法大学中央高校基本科研业务费专项资金资助项目“开放政府数据利用及保障研究”(项目编号:2722024BQ053)
中南财经政法大学校级教学改革研究项目“面向用户的开放教育资源使用行为影响机制研究——以公共管理类课程为例”(项目编号:YB202319)的成果。
文摘
[目的/意义]数字政府建设是政府改革的重要驱动力之一,央地数字政府政策形成良好的协同状态可以最大化发挥数字政府建设转变政府职能、打破信息壁垒等作用。通过对数字政府政策央地协同状况的量化研究,可以厘清央地数字政府政策目标瞄准、文本创新与施行成效现状。[方法/过程]以2019—2023年央地336项数字政府政策为研究样本,利用LDA主题建模法、Doc2Vec、PMC指数分析法建立“主题响应度—文本相似度—成效协同度”三维分析框架,进行数字政府政策央地协同状况量化研究。[结果/结论]央地现有数字政府政策数量较多,但省份间、地区间存在较大差异,央地政策主题协同效果良好,政策文本承继与创新呈现平衡状态,部分省份政策成效需要进一步加强,以促进央地政策良性耦合与扩散发展。
关键词
数字政府
央地协同
政策文本
LDA主题模型
doc2vec
PMC指数模型
Keywords
digital government
central-local coordination
policy text
LDD theme
model
doc2vec
PMC index
model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
D63 [政治法律—中外政治制度]
原文传递
题名
基于LDA模型和Doc2vec的学术摘要聚类方法
被引量:
21
2
作者
张卫卫
胡亚琦
翟广宇
刘志鹏
机构
兰州交通大学电子与信息工程学院
兰州理工大学经济管理学院
出处
《计算机工程与应用》
CSCD
北大核心
2020年第6期180-185,共6页
基金
中国博士后科学基金(No.2016M600827)
国家自然科学基金(No.71861026)
教育部哲学社会科学研究重大课题攻关项目(No.16JZD023)
文摘
针对特定任务下的短文本聚类已经成为文本数据挖掘的一项重要任务。学术摘要文本由于数据稀疏造成了聚类结果准确率低、语义鸿沟问题,狭窄的域导致大量无关紧要的单词重叠,使得很难区分主题和细粒度集群。鉴于此,提出一种新的聚类模型——主题句向量模型(Doc2vec-LDA,Doc-LDA),该模型通过将LDA主题模型(Latent Dirichlet Allocation)和句向量模型融合(Doc2vec),不仅使得在模型训练过程中既能利用整个语料库的信息,而且还利用Paragraph Vector的局部语义空间信息完善LDA的隐性语义信息。实验采用爬取到的知网摘要文本作为数据集,选用K-Means聚类算法对各模型的摘要文本进行效果比较。实验结果表明,基于Doc-LDA模型的聚类效果优于LDA、Word2vec、LDA+Word2vec模型。
关键词
短文本聚类
LDA模型
doc2vec
模型
学术摘要
Keywords
short text clustering
Latent Dirichlet Allocation(LDA)
model
doc2vec model
academic abstract
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Doc2Vec与SVM的聊天内容过滤
被引量:
5
3
作者
岳文应
机构
浙江理工大学信息学院
出处
《计算机系统应用》
2018年第7期127-132,共6页
文摘
直播系统中用户聊天内容的实时拦截具有非常重大的意义,为了提高分类的准确率和效率,提出了一种基于Doc2Vec与SVM结合的文本分类模型对聊天内容分类,判断聊天内容是否应该被拦截.首先使用Doc2Vec模型将聊天内容表示成密集数值向量的形式,第二部分使用SVM分类器进行分类.通过实验表明,该模型有效地减少了文本表示的维度,提高了训练效率,而且具有的97%的准确率和89.82%召回率,性能优于朴素贝叶斯和基于Doc2Vec的Logistic模型.
关键词
文本分类
自然语言处理
doc2vec
模型
支持向量机
Keywords
text classification
Natural Language Processing (NLP)
doc2vec model
Support Vector Machine (SVM)
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合LDA主题和Doc2vec算法的DeepFM模型的推荐算法研究
被引量:
3
4
作者
刘伦珲
吴丽萍
机构
昆明理工大学信息工程与自动化学院
出处
《电视技术》
2022年第4期47-53,共7页
基金
国家科学基金(NO.62166021
NO.61365010)。
文摘
如今,有很多辅助决策算法在日常生活的各个方面为人们推荐个性化内容或产品。本文以医疗信息推荐作为案例,研究提出一种融合狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型和Doc2vec算法的DeepFM模型。该模型能够挖掘评论文本中的隐藏主题和隐藏特征并考虑隐藏特征的交叉情况,能够在保留评论文本表层信息的同时学习数据中的浅层和深层特征。本文将该模型与之前的模型在真实的数据上进行实验对比。实验结果表明,相较于现存模型,该模型的推荐准确率有了一定的提高。
关键词
推荐系统
LDA主题模型
doc2vec
DeepFM
Keywords
recommendation system
LDA topic
model
doc2vec
DeepFM
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于文本融合特征的突发事件子话题聚类研究
5
作者
芦子涵
郑中团
机构
上海工程技术大学数理与统计学院
出处
《智能计算机与应用》
2023年第10期45-51,55,共8页
基金
全国统计科学研究项目(2020LY080)。
文摘
突发事件具有突发性、公共性、传播范围广等特点,研究同一突发事件中更细粒度的子话题聚类,对舆情管控部门实现精准化管控具有重要意义。针对以往话题聚类方法忽略了同一事件下更细粒度的子话题聚类,且为了更有效地表达微博文本的语义信息,提出一种基于LDA文档-主题分布与Doc2Vec句向量融合的文本特征表示方法与文本相似度计算方法,应用Single-Pass增量聚类算法实现同一突发事件下子话题聚类,并根据F1值与单一文本特征子话题聚类实验结果进行对比。结果表明,本文方法子话题聚类效果更佳,F1值为72.4%,表明该方法能够有效地表达文本特征,进而提高子话题聚类的准确度。
关键词
突发事件
子话题聚类
文本特征
LDA主题模型
doc2vec
模型
Keywords
emergency
sub-topic clustering
text features
LDA topic
model
doc2vec model
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多源文本挖掘的技术演化路径识别
被引量:
9
6
作者
刘怀兰
刘盛
周源
张睿
机构
华中科技大学机械科学与工程学院
清华大学公共管理学院
出处
《情报理论与实践》
CSSCI
北大核心
2022年第11期178-187,共10页
基金
国家自然科学基金项目“面向2035的高档数控机床技术路线图研究”的成果,项目编号:L1824043。
文摘
[目的/意义]提出一种基于文档向量化和自动化短语挖掘的改进主题建模方法(Doc2Vec-KMeans++-TopMine,DKT),从多维视角识别领域内的技术演化路径,展示领域内技术的发展与现状。[方法/过程]获取研究领域内的论文、专利、产品等多源数据,综合采用文档向量化、聚类算法和短语挖掘算法,完成领域多源数据的融合主题挖掘,通过语义相似度计算进行多源融合主题的关联与演化路径的识别,采用“主题河流图”可视化方法绘制多维度技术演化路径,从前沿研究、技术研发、市场应用等多维度视角出发开展领域演化分析。[结果/结论]选取数控机床领域进行实证研究,实验结果表明,利用DKT方法挖掘到的演化路径信息丰富,可以进行多维技术演化路径分析,并证明了其有效性,同时还得到了多个维度视角下的领域发展过程,发现了数控机床领域的3种技术演化模式。
关键词
技术演化路径
多源数据
主题建模
文本挖掘
doc2vec
TopMine
Keywords
technology evolution pathway
multi-source data
topic
model
ing
text mining
doc2vec
TopMine
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于改进TextRank算法的中文文本摘要提取
被引量:
24
7
作者
徐馨韬
柴小丽
谢彬
沈晨
王敬平
机构
中国电子科技集团公司第三十二研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第3期273-277,共5页
基金
国家部委基金
文摘
为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重影响因子的TextRank算法对文本语句进行排序,并提取主题句生成摘要。实验结果表明,DK-TextRank算法在摘要语句数量为7时F值达到79.36%,相比传统TF-IDF、TextRank算法提取的摘要质量更高。
关键词
doc2vec
模型
K-MEANS算法
TextRank算法
摘要提取
权重影响因子
Keywords
doc2vec model
K-means algorithm
TextRank algorithm
summarization extraction
weight influence factor
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合文本分布式表示的重复缺陷报告检测
被引量:
2
8
作者
曾杰
贲可荣
张献
徐永士
机构
海军工程大学电子工程学院
出处
《计算机工程与科学》
CSCD
北大核心
2021年第4期670-680,共11页
文摘
重复缺陷报告检测能够避免对描述同一缺陷的多份报告进行重复的任务分派和修复,可降低软件维护成本。为了进一步提高检测的准确率,提出一种融合文本分布式表示的重复缺陷报告检测方法。首先,基于大规模缺陷报告数据库训练Doc2Vec模型并抽取缺陷报告的分布式表示,将不同长度的缺陷报告编码为统一长度的稠密向量。接着,通过比较这些向量来计算不同缺陷报告的相似程度,将其作为一种新特征与重复缺陷报告检测过程常用的其它特征进行融合,并利用机器学习算法训练二元分类模型。在公开的Bugzilla重复缺陷报告数据集上的实验结果表明,相比于代表性方法D_TS,本文方法的F1值平均提升了2%,说明了新特征的有效性。
关键词
重复缺陷报告
文本分布式表示
doc2vec
模型
机器学习算法
Keywords
duplicate bug report
distributed representations of documents
doc2vec model
machine learning algorithm
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
数字政府政策央地协同量化研究——基于三维分析框架的文本分析
陈美
聂佳睿
《情报理论与实践》
CSSCI
北大核心
2024
0
原文传递
2
基于LDA模型和Doc2vec的学术摘要聚类方法
张卫卫
胡亚琦
翟广宇
刘志鹏
《计算机工程与应用》
CSCD
北大核心
2020
21
下载PDF
职称材料
3
基于Doc2Vec与SVM的聊天内容过滤
岳文应
《计算机系统应用》
2018
5
下载PDF
职称材料
4
融合LDA主题和Doc2vec算法的DeepFM模型的推荐算法研究
刘伦珲
吴丽萍
《电视技术》
2022
3
下载PDF
职称材料
5
基于文本融合特征的突发事件子话题聚类研究
芦子涵
郑中团
《智能计算机与应用》
2023
0
下载PDF
职称材料
6
基于多源文本挖掘的技术演化路径识别
刘怀兰
刘盛
周源
张睿
《情报理论与实践》
CSSCI
北大核心
2022
9
原文传递
7
基于改进TextRank算法的中文文本摘要提取
徐馨韬
柴小丽
谢彬
沈晨
王敬平
《计算机工程》
CAS
CSCD
北大核心
2019
24
下载PDF
职称材料
8
融合文本分布式表示的重复缺陷报告检测
曾杰
贲可荣
张献
徐永士
《计算机工程与科学》
CSCD
北大核心
2021
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部