期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
机器学习算法在渔船数据挖掘技术中的应用
1
作者 刘敏 《黄山学院学报》 2024年第3期13-16,共4页
本文基于PCA_Word2Vec的渔船数据挖掘技术展开研究,构建了PCA_Word2Vec渔船数据挖掘模型并对渔船轨迹数据进行挖掘,在此基础之上通过将LightGBM模型与其他经典模型分类效果进行比较,以及对PCA_Word2Vec数据挖掘模型挖掘前后的数据展开对... 本文基于PCA_Word2Vec的渔船数据挖掘技术展开研究,构建了PCA_Word2Vec渔船数据挖掘模型并对渔船轨迹数据进行挖掘,在此基础之上通过将LightGBM模型与其他经典模型分类效果进行比较,以及对PCA_Word2Vec数据挖掘模型挖掘前后的数据展开对比,验证了渔船数据挖掘技术的有效性和实用性。 展开更多
关键词 机器学习算法 pca_word2vec数据挖掘模型 数据挖掘 渔船识别
下载PDF
我国数据安全政策文本主题挖掘及其演化分析
2
作者 马海群 崔文波 张涛 《现代情报》 CSSCI 北大核心 2024年第8期28-38,共11页
[目的/意义]揭示数据安全政策主题的演化规律,对完善数据安全政策体系具有重要意义。[方法/过程]本文选取我国547部数据安全政策文本,利用NMF主题模型进行主题挖掘并结合Word2Vec词向量模型,从主题内容演化和主题强度演化两个视角进行... [目的/意义]揭示数据安全政策主题的演化规律,对完善数据安全政策体系具有重要意义。[方法/过程]本文选取我国547部数据安全政策文本,利用NMF主题模型进行主题挖掘并结合Word2Vec词向量模型,从主题内容演化和主题强度演化两个视角进行可视化处理与分析。[结果/结论]识别出网络安全、应急处置、安全保障、个人隐私等主题,而主题演化内容呈现聚集性,演化领域呈现扩散性;数据开放、公共数据等核心主题整体演化强度趋势不断提高,但个人隐私、安全可控、监测预警相关主题政策占比失衡。针对主题挖掘及演化分析结果,并结合我国数据安全治理现状提出4点建议:持续加强数据开放与安全的协同;加强全流程的数据安全治理;完善技术与政策融合的数据安全治理机制;平衡政策主题演化注意力分配。 展开更多
关键词 数据安全政策 数据治理 数据开放 数据安全 NMF Word2vec 主题挖掘 主题演化
下载PDF
基于数据挖掘技术构建适宜基层应用的2型糖尿病视网膜病变风险预测模型研究 被引量:6
3
作者 陈韦冰 张巧玲 +4 位作者 徐小红 郭艳芳 廖美艳 刘峥 徐国平 《中国实用医药》 2019年第2期181-182,共2页
目的研究分析基于数据挖掘技术构建适宜基层应用的2型糖尿病视网膜病变风险预测模型。方法 300例确诊的2型糖尿病患者,随机分为模型组(250例)和对照组(50例),建立适合基层的"糖尿病风险因素评估+视网膜病变设备检测+血糖控制"... 目的研究分析基于数据挖掘技术构建适宜基层应用的2型糖尿病视网膜病变风险预测模型。方法 300例确诊的2型糖尿病患者,随机分为模型组(250例)和对照组(50例),建立适合基层的"糖尿病风险因素评估+视网膜病变设备检测+血糖控制"预测模型。两组均进行免散瞳眼底彩色照相及相关化验等,引用数据挖掘技术,通过多因素Logistic回归分析研究视网膜病变关联因素。结果检测600只眼,视网膜病变眼数200只;重度非增生型眼数和增生型眼数分别为105、95只。对照组100只眼,视网膜病变眼数32只,重度非增生型眼数和增生型眼数分别为15、17只;模型组500只眼,视网膜病变眼数168只,重度非增生型眼数和增生型眼数分别为90、78只。单因素回归分析显示,年龄、病程、糖化血红蛋白、尿蛋白、眼轴长度是2型糖尿病患者发生视网膜病变的影响因素(P<0.05)。多因素回归分析显示, 2型糖尿病视网膜病变的风险因素主要有眼轴长度、年龄、病程、糖化血红蛋白以及尿蛋白。构建ROC曲线,对照组测算曲线下面积数值为0.800,临界值结果为0.184,简化回归方程分析诊断临界值结果为-1.479。对照组患者将相关的计算参数列入回归方程,敏感性、特异性、曲线下面积数值分别为86.0%、58.0%、0.762,伴随预测评分结果与视网膜病变患病率成正向关系,若评分结果<-2.5,则实际患病率为0。结论 2型糖尿病视网膜病变诱发因素很多,主要与患者病程、眼轴长度、年龄、糖化血红蛋白、尿蛋白等因素有关,同时验证了风险预测模型的有效性。 展开更多
关键词 数据挖掘技术 2型糖尿病 视网膜病变 风险预测 模型
下载PDF
基于Word2Vec的SCI地址字段数据清洗方法研究 被引量:15
4
作者 孙源 《情报杂志》 CSSCI 北大核心 2019年第2期195-200,共6页
[目的/意义]旨在设计一种有效针对SCI地址字段的数据清洗方案,将Word2Vec词向量模型引入到SCI地址字段的清洗过程中,利用地址字段中上下文的信息,识别SCI地址字段中机构名称的不同写法,最终建立"机构名称映射表",达到数据清... [目的/意义]旨在设计一种有效针对SCI地址字段的数据清洗方案,将Word2Vec词向量模型引入到SCI地址字段的清洗过程中,利用地址字段中上下文的信息,识别SCI地址字段中机构名称的不同写法,最终建立"机构名称映射表",达到数据清洗的目的。[方法/过程]首先,对SCI地址字段的数据进行预处理,按照规律将地址字段的信息构建成专有名词。然后,引入Word2Vec模型训练,利用训练好的模型结合余弦相似度找出与待清洗机构名相似的拼写形式。最后,建立"机构名称映射表"完成清洗。[结果/结论]通过实证分析发现,第一,在相同阈值下,该方法针对机构的识别准确要比传统字符匹配的方法要高。第二,在机构名变体与缩写的识别能力上有较好的表现。第三,该方法的运算速度是传统字符匹配算法的近40倍。Word2Vec词向量模型在数据清洗中有一定应用价值,能够根据SCI地址字段的上下文信息,清洗出指定机构名称的形似、变体和缩写机构名,从而达到数据规范化的目的。 展开更多
关键词 数据清洗 Word2vec 词向量模型 SCI地址字段
下载PDF
基于LDA-加权Word2Vec组合的机器学习情感分类模型研究
5
作者 陈登建 杜飞霞 +2 位作者 吴瑞雪 杨秀璋 夏换 《现代计算机》 2022年第18期16-22,共7页
为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征(LDA-Word2Vec)的情感分类模型。通过LDA... 为解决社交媒体用户发布评论文本过长,导致情感倾向不明确,情感特征分布离散,传统情感分类模型缺乏上下文语义分析,提取情感特征不准确,分类精准率较低的难题,提出一种主题模型与词向量组合特征(LDA-Word2Vec)的情感分类模型。通过LDA主题模型对长评论文本进行特征提取,构建所有主题下的特征词库;借助特征词库构建长评论的LDA特征表达;利用CBOW训练得到特征表达后文本的词向量表示,使用TF-IDF对词向量进行加权并融合语义特征,再构建机器学习模型对长评论文本进行情感分类的方法,研究了机器学习情感分类模型。实验结果表明:相较于传统的文本特征表示方法,本文提出的LDA-Word2Vec组合特征的方法,在情感分类的准确率与召回率的表现上都更加优秀。可见本文的模型能够进一步挖掘文本的情感特征,具有一定学术意义和现实意义。 展开更多
关键词 LDA主题挖掘 Word2vec模型 机器学习 情感分类
下载PDF
基于word2vec和LDA的文本主题 被引量:7
6
作者 徐守坤 周佳 +1 位作者 李宁 石林 《计算机工程与设计》 北大核心 2018年第9期2764-2769,共6页
将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模型进行建模,提取主题相关词汇作为初始主题词集;依据word2vec模型提取与初始主题词集语义相似的词汇,将初... 将word2vec和LDA算法相结合,对文本主题进行提取研究。通过已有的分词工具实现文本分词,提取文本中的词汇;对语料库依据LDA主题模型进行建模,提取主题相关词汇作为初始主题词集;依据word2vec模型提取与初始主题词集语义相似的词汇,将初始主题词汇之间的相似度和向量邻接关系按照权重不同重新分配,改进Gibbs抽样,对LDA进行改进,提高主题挖掘的准确性和稳定性。实验结果表明,当训练语料分布合理时,经过LDA和word2vec的有效结合,主题词抽取效果有所提高,验证了该方法的可行性。 展开更多
关键词 自然语言处理 LDA模型 主题挖掘 word2vec模型 GIBBS抽样
下载PDF
基于ART2网络的三维模型聚类分析方法 被引量:3
7
作者 李山 石源 刘红军 《计算机集成制造系统》 EI CSCD 北大核心 2011年第9期1865-1872,共8页
为解决三维模型聚类中存在的聚类结果对数据输入顺序和维度敏感的问题,将基于自适应谐振理论的ART2网络引入到模型聚类中。以Rand指数、调整Rand指数和互信息指数3种聚类有效性评价指标为依据,通过实验分析了ART2网络中a,b,c,d,θ五个... 为解决三维模型聚类中存在的聚类结果对数据输入顺序和维度敏感的问题,将基于自适应谐振理论的ART2网络引入到模型聚类中。以Rand指数、调整Rand指数和互信息指数3种聚类有效性评价指标为依据,通过实验分析了ART2网络中a,b,c,d,θ五个参数对聚类有效性的影响,并给出了一组较优的参数组合。在此基础上,定性地分析了警戒系数对聚类结果的影响,其中包括最大聚类数的确定和聚类结果对输入顺序的敏感度。聚类结果验证了ART2网络在模型聚类上的可行性和实用性。 展开更多
关键词 三维模型 聚类分析 ART2网络 聚类有效性评估 数据挖掘
下载PDF
基于大数据的产品族本体造型意象挖掘方法研究 被引量:4
8
作者 王鹏 朱韦龙 《图学学报》 CSCD 北大核心 2021年第6期1051-1060,共10页
为提升产品造型意象成族的准确性,增强感性工学研究中意象词汇提取的规范性和知识重用性。首先从同族、泛族、异族的概念切入,对目标产品族的造型意象本体进行了定义;再借助word2vec工具和主成分分析法(PCA)分别完成了对产品族意象词汇... 为提升产品造型意象成族的准确性,增强感性工学研究中意象词汇提取的规范性和知识重用性。首先从同族、泛族、异族的概念切入,对目标产品族的造型意象本体进行了定义;再借助word2vec工具和主成分分析法(PCA)分别完成了对产品族意象词汇的关联性联想和降维提取,从而构建了意象词汇挖掘机制,通过此机制可以辅助设计师利用网络大数据资源更高效、准确地进行目标产品意象的挖掘,一定程度上解决了传统感性工学在意象挖掘方法中模糊性。最后结合意象词汇与造型特征的映射关系,利用Protege工具构建了产品族造型意象的本体模型,对目标产品的造型意象知识进行了逻辑化表征,为下一代产品继承并发展原产品族造型意象提供参考。以马自达MX-5车系的造型意象为例构建了本体模型,并进行了子代产品前脸的概念设计。 展开更多
关键词 产品族 本体模型 意象挖掘 Word2vec 主成分分析法
下载PDF
基于J2EE的企业内容管理模型和实现方案分析 被引量:2
9
作者 周笑庭 张卫华 付林 《达县师范高等专科学校学报》 2003年第2期50-52,58,共4页
本文针对当前企业信息化建设的特点 ,分析了企业内容管理模型的构架及其解决方案 ,最终提出了在J2EE平台上构建的企业内容管理模型的具体实现方案 ,利用RMI及CORBA的有效结合 ,解决了大型企业在内容管理模型构建过程中出现的需要充分保... 本文针对当前企业信息化建设的特点 ,分析了企业内容管理模型的构架及其解决方案 ,最终提出了在J2EE平台上构建的企业内容管理模型的具体实现方案 ,利用RMI及CORBA的有效结合 ,解决了大型企业在内容管理模型构建过程中出现的需要充分保护现有投资 ,利用遗留信息系统等系统集成的问题 。 展开更多
关键词 企业信息化 企业内容管理模型 J2EE 企业信息系统 企业知识库 数据挖掘
下载PDF
基于招聘信息文本挖掘的信管专业人才社会需求研究 被引量:1
10
作者 李娟 魏佳 +2 位作者 张珊珊 周树功 詹胜 《科教文汇》 2023年第19期105-109,共5页
该文从人才市场需求出发,针对就业网站数据,运用文本挖掘方法分析相关人才的社会需求,旨在为高校信管专业教育教学改革提出建设性意见。使用爬虫技术获取招聘信息,对爬取的数据集进行语料预处理、中文分词等,并使用Word2Vec模型对文本... 该文从人才市场需求出发,针对就业网站数据,运用文本挖掘方法分析相关人才的社会需求,旨在为高校信管专业教育教学改革提出建设性意见。使用爬虫技术获取招聘信息,对爬取的数据集进行语料预处理、中文分词等,并使用Word2Vec模型对文本信息进行向量化操作,对词频进行统计,对招聘信息的不同字段进行分析,根据需求量较大的程序设计类和数据类的职位,从重构信管专业课程体系、构建信管专业核心能力指标、重视实践经验积累三方面提出对策和建议。 展开更多
关键词 文本挖掘 信管专业 Word2vec模型 爬虫技术
下载PDF
融合Word2Vec和层次分析法的医生推荐研究 被引量:1
11
作者 王妞妞 熊回香 刘樱 《中华医学图书情报杂志》 CAS 2022年第1期20-31,共12页
目的:向有健康咨询需求的患者推荐高专业度和高活跃度的医生,进一步完善在线问诊平台功能。方法:融合Word2Vec和层次分析法构建医生推荐模型,以“好大夫在线”网站作为实证对象,验证模型适用性。首先,基于患者特征,借助Word2Vec和余弦... 目的:向有健康咨询需求的患者推荐高专业度和高活跃度的医生,进一步完善在线问诊平台功能。方法:融合Word2Vec和层次分析法构建医生推荐模型,以“好大夫在线”网站作为实证对象,验证模型适用性。首先,基于患者特征,借助Word2Vec和余弦相似度,得到相似患者集合,通过医生和患者的实际问诊关系得到医生推荐序列C。然后,运用层次分析法建立医生诊断能力评分体系,计算出各项指标权重及医生得分,按照得分递减顺序输出医生推荐序列D。融合医生推荐序列C和医生推荐序列D得到最终医生推荐集合E。结果:该模型综合考虑了医生的专业程度和活跃程度,所推荐的医生在临床经验上具备较高的相似度,且在线活跃度较高。结论:融合Word2Vec和层次分析法的模型具有较好的推荐效果,实践过程中需充分调研患者需求以确保模型更具代表性。 展开更多
关键词 数据挖掘 Word2vec 层次分析法 医生推荐
下载PDF
基于数据挖掘的2型糖尿病动物模型应用分析 被引量:11
12
作者 黄湘宁 姚心怡 +1 位作者 谭艳 喻嵘 《中国实验方剂学杂志》 CAS CSCD 北大核心 2023年第2期159-165,共7页
目的:研究2型糖尿病(T2DM)动物模型的造模要素及检测指标,为建立经济易行且符合发病机制的动物模型提供参考,为相关发病机制、药效机制研究提供更佳的研究基础。方法:通过在中国知网、万方、PubMed等数据库中检索近10年收录的T2DM动物... 目的:研究2型糖尿病(T2DM)动物模型的造模要素及检测指标,为建立经济易行且符合发病机制的动物模型提供参考,为相关发病机制、药效机制研究提供更佳的研究基础。方法:通过在中国知网、万方、PubMed等数据库中检索近10年收录的T2DM动物实验文献,整理归纳实验动物种类、性别、造模方式、检测指标、方法等建立数据库,用Excel、SPSS 18.0进行数据分析。结果:筛选纳入文献共249篇,T2DM动物实验造模多选用雄性SD大鼠;造模方式多为化学加饮食诱导,化学诱导药物以链脲佐菌素(STZ)为主,饮食诱导以高脂高糖饲料为主;检测指标包括血清生化指标、组织病理学、相关指数等。结论:T2DM动物实验通常选用雄性SD大鼠,以高脂高糖饲料(含猪油10%、20%蔗糖)或高脂饲料(含40%~60%脂肪)喂养加小剂量STZ(30~40 mg·kg^(-1))单次腹腔注射诱导造模,具有操作简便、成模率高且符合疾病发病过程等优点,结合血糖、血脂谱、血清胰岛素、葡萄糖耐量试验或胰岛素耐量试验及组织病理学等指标,可为T2DM基础动物实验研究提供参考。 展开更多
关键词 2型糖尿病 动物模型 数据挖掘 造模要素 检测指标
原文传递
基于Doc2Vec和BiLSTM的老年患者疾病预测研究 被引量:5
13
作者 藏润强 左美云 郭鑫鑫 《计算机工程与科学》 CSCD 北大核心 2020年第12期2273-2279,共7页
基于电子病历的疾病预测一般是根据病人的症状预测疾病,而很少研究疾病之间的时间顺序关系。引入一种新的电子病历表示法,该表示法考虑了具有时序性的医疗疾病上下文信息,利用Doc2Vec将每种疾病转换成一个类似于其“语义”的数字向量。... 基于电子病历的疾病预测一般是根据病人的症状预测疾病,而很少研究疾病之间的时间顺序关系。引入一种新的电子病历表示法,该表示法考虑了具有时序性的医疗疾病上下文信息,利用Doc2Vec将每种疾病转换成一个类似于其“语义”的数字向量。基于这些向量采用BiLSTM模型来预测老年患者未来的疾病,可以起到对老年疾病的预警作用。最后通过使用真实的医院诊断数据进行实验验证,结果发现模型能够有效地预测出老年人新的疾病,且在保证预测准确率的同时还具有一定的稳定性。 展开更多
关键词 上下文 Doc2vec 双向长短时记忆网络BiLSTM 数据挖掘 疾病预测
下载PDF
基于搜索数据的用户基本属性混合预测模型研究
14
作者 权甜甜 王虎 《现代商贸工业》 2018年第16期202-206,共5页
大数据时代必然会导致"信息过载(information overload)"现象,企业如何在海量的用户行为数据中准确判断用户属性,是精准营销等领域值得思考的问题。特别是在搜索领域,搜索公司几乎无法获得用户的真实属性信息,但用户的基本属... 大数据时代必然会导致"信息过载(information overload)"现象,企业如何在海量的用户行为数据中准确判断用户属性,是精准营销等领域值得思考的问题。特别是在搜索领域,搜索公司几乎无法获得用户的真实属性信息,但用户的基本属性很大程度上可以影响到用户查看不同广告的可能性。基于背景,利用Doc2Vec、TF-IDF算法对搜索数据进行特征提取,并借助机器学习算法、XGBoost算法构建了用户基本属性混合预测模型,并对模型的准确性进行了检验。 展开更多
关键词 搜索数据 Doc2vec TF-IDF 机器学习算法 用户基本属性混合预测模型
下载PDF
电子文档信息自动挖掘系统的I2DEF方法建模技术
15
作者 蔡立军 李立明 《湖南商学院学报》 2002年第3期136-137,共2页
介绍、分析和研究了IDEF方法的建模技术、建模步骤 ,并采用I2 DEF方法建立了电子文档信息自动挖掘系统的结构模型。
关键词 数据挖掘 电子文档 I2DEF方法 结构模型 动态模型 功能模型
下载PDF
基于多源文本挖掘的技术演化路径识别 被引量:9
16
作者 刘怀兰 刘盛 +1 位作者 周源 张睿 《情报理论与实践》 CSSCI 北大核心 2022年第11期178-187,共10页
[目的/意义]提出一种基于文档向量化和自动化短语挖掘的改进主题建模方法(Doc2Vec-KMeans++-TopMine,DKT),从多维视角识别领域内的技术演化路径,展示领域内技术的发展与现状。[方法/过程]获取研究领域内的论文、专利、产品等多源数据,... [目的/意义]提出一种基于文档向量化和自动化短语挖掘的改进主题建模方法(Doc2Vec-KMeans++-TopMine,DKT),从多维视角识别领域内的技术演化路径,展示领域内技术的发展与现状。[方法/过程]获取研究领域内的论文、专利、产品等多源数据,综合采用文档向量化、聚类算法和短语挖掘算法,完成领域多源数据的融合主题挖掘,通过语义相似度计算进行多源融合主题的关联与演化路径的识别,采用“主题河流图”可视化方法绘制多维度技术演化路径,从前沿研究、技术研发、市场应用等多维度视角出发开展领域演化分析。[结果/结论]选取数控机床领域进行实证研究,实验结果表明,利用DKT方法挖掘到的演化路径信息丰富,可以进行多维技术演化路径分析,并证明了其有效性,同时还得到了多个维度视角下的领域发展过程,发现了数控机床领域的3种技术演化模式。 展开更多
关键词 技术演化路径 多源数据 主题建模 文本挖掘 Doc2vec TopMine
原文传递
基于医患交互数据的在线医生推荐研究 被引量:10
17
作者 熊回香 李晓敏 李建玲 《情报理论与实践》 CSSCI 北大核心 2020年第8期159-166,共8页
[目的/意义]对医患交互过程中产生的文本数据进行挖掘分析,构建基于医患交互数据的医生推荐模型。[方法/过程]对患者咨询文本,利用word2vec模型和余弦相似度计算患者与患者间相似度,形成基于相似患者的医生推荐集;对医生被咨询文本,利用... [目的/意义]对医患交互过程中产生的文本数据进行挖掘分析,构建基于医患交互数据的医生推荐模型。[方法/过程]对患者咨询文本,利用word2vec模型和余弦相似度计算患者与患者间相似度,形成基于相似患者的医生推荐集;对医生被咨询文本,利用TF-IDF+word2vec模型和余弦相似度计算医生与医生间被咨询文本相似度,对医生积累的临床经验,利用文本相似度计算方法计算医生与医生间经验相似度,两部分医生相似度求和取平均形成基于相似医生的医生推荐集。融合基于相似患者的推荐集和基于相似医生的推荐集实现医生推荐。[结果/结论]以"好大夫在线"为例对模型进行验证,并随机选择11位患者进行模型测试,结果表明本文提出的模型推荐效果较好,能够帮助患者在所选医生没有可用资源时选择合适的医生,减少患者时间和医生资源的浪费。[局限]主要选取的是文本型数据,对于网站其他类型的数据并未涉及。 展开更多
关键词 数据挖掘 文本相似度 word2vec模型 患者咨询文本 医生推荐
原文传递
基于中间件的Web挖掘的研究现状分析 被引量:1
18
作者 贾宇波 冯志友 +1 位作者 孙淑荣 王永利 《计算机应用研究》 CSCD 北大核心 2003年第2期4-7,共4页
介绍了组件技术及知识发现的概念,阐述了在软件构架支持下,利用组件堆积木似的搭建知识发现系统的特点;提出了一个基于J2EE面向电子商务的WebMining系统的设计方案。
关键词 中间件 WEB 数据挖掘 数据模型 数据 电子商务 知识发现 J2EE
下载PDF
智慧医疗资讯个性化服务平台医学感知
19
作者 刘彦宏 郑琳那 +3 位作者 王榕 曲金鑫 毛云 崔永瑞 《计算机科学与应用》 2024年第2期360-370,共11页
本文旨在研究一款智慧医疗资讯个性化服务平台——医学感知。传统的医疗资讯平台并不具备人工智能的相关算法帮助医生或者病人更准确、高效地获取医疗建议。本平台融合了三种不同的自然语言处理技术TF-IDF、Word2Vec、BERT等机器学习算... 本文旨在研究一款智慧医疗资讯个性化服务平台——医学感知。传统的医疗资讯平台并不具备人工智能的相关算法帮助医生或者病人更准确、高效地获取医疗建议。本平台融合了三种不同的自然语言处理技术TF-IDF、Word2Vec、BERT等机器学习算法,通过实验比较出三者对于医疗信息匹配的不同特点从而为用户打造一个更加智能、更具人性化的医疗资讯服务平台。该平台基于Python语言及Django框架和MySQL数据库进行搭建,通过Requests和Beautiful Soup库实现对医疗数据的采集。 展开更多
关键词 医学感知 自然语言处理 TF-IDF Word2vec BERT Django框架 数据挖掘
下载PDF
基于在线评论的企业竞争情报需求挖掘研究 被引量:21
20
作者 谷莹 李贺 +1 位作者 李叶叶 刘嘉宇 《现代情报》 CSSCI 2021年第1期24-31,共8页
[目的/意义]提出一种基于在线产品评论的竞争情报挖掘框架,为企业改进产品设计和制定竞争策略提供参考。[方法/过程]利用Word2vec技术构建产品特征词集合,识别用户评论主题特征。然后使用情感分析方法对评论文本进行分类,得到特征维度... [目的/意义]提出一种基于在线产品评论的竞争情报挖掘框架,为企业改进产品设计和制定竞争策略提供参考。[方法/过程]利用Word2vec技术构建产品特征词集合,识别用户评论主题特征。然后使用情感分析方法对评论文本进行分类,得到特征维度的评论情感。最后从产品主题特征和情感态度特征两方面进行数据分析,并以可视化结果呈现。[结果/结论]以汽车行业的评论数据为例进行实验,结果表明该方法能够有效提取产品情报信息,帮助企业有效识别自身品牌及竞争对手的优势和劣势,为大数据环境下的竞争情报挖掘提供方法指导。 展开更多
关键词 在线评论 企业 竞争情报 数据挖掘 Word2vec 情感分析 汽车行业
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部