期刊文献+
共找到51,617篇文章
< 1 2 250 >
每页显示 20 50 100
基于LDA和Word2Vec模型的学位论文评阅意见主题挖掘与分析
1
作者 王孟 苏进城 陈志德 《福建师范大学学报(自然科学版)》 CAS 北大核心 2024年第5期41-51,共11页
选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将... 选取某高校部分硕士学位论文评阅意见为研究对象,使用自然语言处理和机器学习技术进行自动化的硕士学位论文评阅意见主题挖掘与分析。首先,采用LDA(latent dirichlet allocation)模型对评阅数据进行主题建模,提取文本中的潜在主题,并将评阅意见转化为主题分布向量;其次,结合Word2Vec模型将评阅意见的关键词转化为向量表达;最后,采用TextRank方法提取关键词,以揭示评阅专家的关注核心主题。实验结果表明,所提方法能为高校管理人员提供切实有效的分析工具,有助于他们更好地分析总结评阅意见,同时也为硕士研究生撰写高质量学位论文提供有益借鉴。 展开更多
关键词 硕士学位论文 自然语言处理 LDA模型 word2Vec模型 TextRank方法
下载PDF
基于Word2Vec和LDA主题模型的中国省级五年规划“文化政策”文本研究
2
作者 高娜 东梅 《网络安全与数据治理》 2024年第7期47-55,共9页
运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、... 运用Word2Vec和LDA相结合的主题模型分析技术,对我国31个省份三个时期五年规划文本中文化政策部分进行主题识别,从时间和空间两个维度进行“文化政策”主题挖掘和演化分析。研究发现,“文化政策”主题在发展趋势、重点转移、政策导向、技术应用等方面随时间推移呈现不同演化趋势;四大区域受经济发展水平、文化资源禀赋、政策导向影响,在企业角色强调程度、地区特色旅游发展以及国家级项目和竞争力方面存在地域差异。 展开更多
关键词 LDA主题模型 word2Vec 五年规划 文化政策 文本分析
下载PDF
英语word的字词之辨
3
作者 高斐 《海外英语》 2024年第20期65-67,共3页
将所有的English words统称为“英语单词”或“英语单字”都是片面的。这种字词不分的观念是导致中国学生学习和记忆英语单词困难的一个主要原因。英语和汉语一样,也应当区分字和词。英语中的词根(基本单词和黏附词根)应被视为“字”,... 将所有的English words统称为“英语单词”或“英语单字”都是片面的。这种字词不分的观念是导致中国学生学习和记忆英语单词困难的一个主要原因。英语和汉语一样,也应当区分字和词。英语中的词根(基本单词和黏附词根)应被视为“字”,而由词根派生出来的大量较复杂的单词才是“词”。将英语中少量的“字”与大量的“词”区分开,从认识英语词根开始,以字带词的方式学习,有助于快速识记大量英语词汇。 展开更多
关键词 英语单词 word
下载PDF
Python实现Excel文档转换到Word文档的自动化方法
4
作者 刘易 《电脑编程技巧与维护》 2024年第5期45-47,共3页
通过研究开发了一种基于Python语言,实现Excel数据自动转换成Word文档并实现排版功能的方法,为科研工作者、数据分析师或报告撰写人员提供一个方便快捷的工具,帮助他们更高效地完成Excel数据转换成Word并实现排版的任务。
关键词 PYTHON语言 Python-docx库 EXCEL文档 word排版
下载PDF
基于Word2Vec和决策树的故障定位技术 被引量:1
5
作者 王露露 陈军华 《上海师范大学学报(自然科学版中英文)》 2024年第2期223-227,共5页
利用Word2Vec方法对Java源代码进行深层语义编码,生成文件级和行级的语义向量,并将其用作输入数据来训练决策树模型,以实现精确的文件级别和行级别故障定位,优化故障检测过程,构建一个综合文件级别与行级别分析的高效故障定位框架.实验... 利用Word2Vec方法对Java源代码进行深层语义编码,生成文件级和行级的语义向量,并将其用作输入数据来训练决策树模型,以实现精确的文件级别和行级别故障定位,优化故障检测过程,构建一个综合文件级别与行级别分析的高效故障定位框架.实验结果表明:该模型在各项目中的故障定位准确率均高于83%. 展开更多
关键词 故障定位 语义表示 word2Vec 决策树
下载PDF
基于LDA-Word2vec的图书情报领域机器学习研究主题演化与热点主题识别 被引量:4
6
作者 胡泽文 韩雅蓉 王梦雅 《现代情报》 CSSCI 北大核心 2024年第4期154-167,共14页
[目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以... [目的/意义]在人工智能技术及应用快速发展与深刻变革背景下,机器学习领域不断出现新的研究主题和方法,深度学习和强化学习技术持续发展。因此,有必要探索不同领域机器学习研究主题演化过程,并识别出热点与新兴主题。[方法/过程]本文以图书情报领域中2011—2022年Web of Science数据库中的机器学习研究论文为例,融合LDA和Word2vec方法进行主题建模和主题演化分析,引入主题强度、主题影响力、主题关注度与主题新颖性指标识别热点主题与新兴热点主题。[结果/结论]研究结果表明,(1)Word2vec语义处理能力与LDA主题演化能力的结合能够更加准确地识别研究主题,直观展示研究主题的分阶段演化规律;(2)图书情报领域的机器学习研究主题主要分为自然语言处理与文本分析、数据挖掘与分析、信息与知识服务三大类范畴。各类主题之间的关联性较强,且具有主题关联演化特征;(3)设计的主题强度、主题影响力和主题关注度指标及综合指标能够较好地识别出2011—2014年、2015—2018年和2019—2022年3个不同周期阶段的热点主题。 展开更多
关键词 机器学习 LDA模型 word2vec 主题演化 热点主题 主题影响力 主题关注度
下载PDF
结合Word2vec和BiLSTM的民航非计划事件分析方法
7
作者 王捷 周迪 +1 位作者 左洪福 黄维 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第7期917-924,共8页
安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采... 安全是民航业的核心主题。针对目前民航非计划事件分析严重依赖专家经验及分析效率低下的问题,文章提出一种结合Word2vec和双向长短期记忆(bidirectional long short-term memory,BiLSTM)神经网络模型的民航非计划事件分析方法。首先采用Word2vec模型针对事件文本语料进行词向量训练,缩小空间向量维度;然后通过BiLSTM模型自动提取特征,获取事件文本的完整序列信息和上下文特征向量;最后采用softmax函数对民航非计划事件进行分类。实验结果表明,所提出的方法分类效果更好,能达到更优的准确率和F 1值,对不平衡数据样本同样具有较稳定的分类性能,证明了该方法在民航非计划事件分析上的适用性和有效性。 展开更多
关键词 民航安全 文本分析 非计划事件 word2vec 双向长短期记忆(BiLSTM)神经网络
下载PDF
基于LSTM+Word2vec的微博评论情感分析 被引量:1
8
作者 王剑辉 闫芳序 《沈阳师范大学学报(自然科学版)》 CAS 2024年第2期138-144,共7页
微博作为当今热门的社交平台,其中蕴含着许多具有强烈主观性的用户评论文本。为挖掘微博评论文本中潜在的信息,针对传统的情感分析模型中存在的语义缺失以及过度依赖人工标注等问题,提出一种基于LSTM+Word2vec的深度学习情感分析模型。... 微博作为当今热门的社交平台,其中蕴含着许多具有强烈主观性的用户评论文本。为挖掘微博评论文本中潜在的信息,针对传统的情感分析模型中存在的语义缺失以及过度依赖人工标注等问题,提出一种基于LSTM+Word2vec的深度学习情感分析模型。采用Word2vec中的连续词袋模型(continuous bag of words,CBOW),利用语境的上下文结构及语义关系将每个词语映射为向量空间,增强词向量之间的稠密度;采用长短时记忆神经网络模型实现对文本上下文序列的线性抓取,最后输出分类预测的结果。实验结果的准确率可达95.9%,通过对照实验得到情感词典、RNN、SVM三种模型的准确率分别为52.3%、92.7%、85.7%,对比发现基于LSTM+Word2vec的深度学习情感分析模型的准确率更高,具有一定的鲁棒性和泛化性,对用户个性化推送和网络舆情监控具有重要意义。 展开更多
关键词 情感分析 word2vec 长短时记忆神经网络 社交平台 微博
下载PDF
基于K-means与Word2vec的哺乳文胸评论主题挖掘研究
9
作者 刘妍 刘驰 《人类工效学》 2024年第2期40-45,共6页
目的为了了解消费者在网络平台购买哺乳文胸时的关注侧重点,文章从在线评论中抽取有效关键词构建哺乳文胸主题,并通过计算主题的重要程度协助商家了解消费者关注重点方向。方法选用TF-IDF关键词抽取算法,结合K-means和Word2vec进行语义... 目的为了了解消费者在网络平台购买哺乳文胸时的关注侧重点,文章从在线评论中抽取有效关键词构建哺乳文胸主题,并通过计算主题的重要程度协助商家了解消费者关注重点方向。方法选用TF-IDF关键词抽取算法,结合K-means和Word2vec进行语义聚类、主题识别、主题词挖掘及主题重要度计算。结果哺乳文胸评论文本聚类后的主题重要程度排名是:产品品质(45.47%)、产品外观(35.83%)、产品服务(18.79%)。结论通过该方法能够有效的识别和构建哺乳文胸主题及主题词,同时,通过主题的重要程度,能够了解消费者对于网络平台购买哺乳文胸时关注的重点方向,为哺乳内衣企业进行产品改善及生产等提供理论参考。 展开更多
关键词 服装工程 文本聚类分析 哺乳文胸 在线评论 K-MEANS word2vec 主题挖掘 主题重要程度 文献计量分析
下载PDF
融合Word2Vec词嵌入的多核卷积神经网络音乐歌词多情感分类方法
10
作者 张昱 冯亚寒 丁千惠 《科学技术与工程》 北大核心 2024年第20期8598-8605,共8页
目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神... 目前,音乐歌词情感分类大多以二标签极性情感为主,多情感标签分类较少,并且对于情感性不确定的歌词而言,得到的分类性能不高。为了解决多情感标签研究分类的不足,以及提高分类准确性,提出一种利用Word2Vec词嵌入技术,并使用多核卷积神经网络作为分类器的音乐歌词多情感分类方法。该方法首先结合音乐歌词文本,进行数据预处理和可视化分析;其次利用Word2Vec词嵌入提取歌词局部特征,构建特征情感向量,挖掘歌词中情感信息,将歌词转化为更利于分类器模型输入的词向量;最后在分类器中,选用卷积神经网络模型,并在此基础上采用不同高度卷积核的方式构建新模型以此得到多情感分类。结果表明:音乐歌词多情感分类的结果达到94.26%,与传统CNN相比,分类精确率提高了6.86%,取得了良好性能。 展开更多
关键词 自然语言处理 情感分类 卷积神经网络 词嵌入 文本分类 音乐歌词
下载PDF
基于Word VBA辅助技术文件编制的数字化协同建设的探索
11
作者 赵静 赵方鑫 《计算机应用文摘》 2024年第6期82-84,共3页
文件编制是设计研发人员日常工作的重要组成部分,其中技术文件的编制涉及大量文件结构和起草规则的应用,基于相关标准中关于文件的编写要求,文章利用WordVBA编程技术辅助技术文件编写工作中的格式编排,实现了Word文档标准格式技术文件... 文件编制是设计研发人员日常工作的重要组成部分,其中技术文件的编制涉及大量文件结构和起草规则的应用,基于相关标准中关于文件的编写要求,文章利用WordVBA编程技术辅助技术文件编写工作中的格式编排,实现了Word文档标准格式技术文件的自动化编制,从而保障文件编制符合标准格式要求,有效提高了工作效率。 展开更多
关键词 技术文件 word VBA编程 自动化
下载PDF
关于Word2Vec文本分类效果若干影响因素的分析 被引量:2
12
作者 谢庆恒 《现代信息科技》 2024年第1期125-129,共5页
Word2Vec向量模型参数众多,在不同情景下分类效果不一,分析其影响因素很有必要。从Word2Vec模型基本原理出发,分析讨论了预训练语料、词向量预训练参数以及分类模型参数三大因素对模型分类效果的影响。结果表明限定域预料效果好于广域预... Word2Vec向量模型参数众多,在不同情景下分类效果不一,分析其影响因素很有必要。从Word2Vec模型基本原理出发,分析讨论了预训练语料、词向量预训练参数以及分类模型参数三大因素对模型分类效果的影响。结果表明限定域预料效果好于广域预料;预训练参数中向量维度越大,效果越好,窗口大小存在最优值,分类算法影响不大;分类模型参数中学习率、激活函数、批次大小对模型分类效果影响较大,训练轮次相对较小。 展开更多
关键词 word2Vec 文本分类 模型效果 影响因素
下载PDF
Towards privacy-preserving and efficient word vector learning for lightweight IoT devices
13
作者 Nan Jia Shaojing Fu +2 位作者 Guangquan Xu Kai Huang Ming Xu 《Digital Communications and Networks》 SCIE CSCD 2024年第4期895-903,共9页
Nowadays,Internet of Things(IoT)is widely deployed and brings great opportunities to change people's daily life.To realize more effective human-computer interaction in the IoT applications,the Question Answering(Q... Nowadays,Internet of Things(IoT)is widely deployed and brings great opportunities to change people's daily life.To realize more effective human-computer interaction in the IoT applications,the Question Answering(QA)systems implanted in the IoT services are supposed to improve the ability to understand natural language.Therefore,the distributed representation of words,which contains more semantic or syntactic information,has been playing a more and more important role in the QA systems.However,learning high-quality distributed word vectors requires lots of storage and computing resources,hence it cannot be deployed on the resource-constrained IoT devices.It is a good choice to outsource the data and computation to the cloud servers.Nevertheless,it could cause privacy risks to directly upload private data to the untrusted cloud.Therefore,realizing the word vector learning process over untrusted cloud servers without privacy leakage is an urgent and challenging task.In this paper,we present a novel efficient word vector learning scheme over encrypted data.We first design a series of arithmetic computation protocols.Then we use two non-colluding cloud servers to implement high-quality word vectors learning over encrypted data.The proposed scheme allows us to perform training word vectors on the remote cloud servers while protecting privacy.Security analysis and experiments over real data sets demonstrate that our scheme is more secure and efficient than existing privacy-preserving word vector learning schemes. 展开更多
关键词 PRIVACY-PRESERVING word vector learning Secret sharing Internet of things
下载PDF
Sentiment Analysis Using E-Commerce Review Keyword-Generated Image with a Hybrid Machine Learning-Based Model
14
作者 Jiawen Li Yuesheng Huang +3 位作者 Yayi Lu Leijun Wang Yongqi Ren Rongjun Chen 《Computers, Materials & Continua》 SCIE EI 2024年第7期1581-1599,共19页
In the context of the accelerated pace of daily life and the development of e-commerce,online shopping is a mainstreamway for consumers to access products and services.To understand their emotional expressions in faci... In the context of the accelerated pace of daily life and the development of e-commerce,online shopping is a mainstreamway for consumers to access products and services.To understand their emotional expressions in facing different shopping experience scenarios,this paper presents a sentiment analysis method that combines the ecommerce reviewkeyword-generated imagewith a hybrid machine learning-basedmodel,inwhich theWord2Vec-TextRank is used to extract keywords that act as the inputs for generating the related images by generative Artificial Intelligence(AI).Subsequently,a hybrid Convolutional Neural Network and Support Vector Machine(CNNSVM)model is applied for sentiment classification of those keyword-generated images.For method validation,the data randomly comprised of 5000 reviews from Amazon have been analyzed.With superior keyword extraction capability,the proposedmethod achieves impressive results on sentiment classification with a remarkable accuracy of up to 97.13%.Such performance demonstrates its advantages by using the text-to-image approach,providing a unique perspective for sentiment analysis in the e-commerce review data compared to the existing works.Thus,the proposed method enhances the reliability and insights of customer feedback surveys,which would also establish a novel direction in similar cases,such as social media monitoring and market trend research. 展开更多
关键词 Sentiment analysis keyword-generated image machine learning word2Vec-TextRank CNN-SVM
下载PDF
标准电子文件转WORD校验方法
15
作者 谭笑 王海虹 +2 位作者 杨萌 张劲松 梅朗一 《中国标准化》 2024年第16期45-49,共5页
随着标准电子文件在各个领域的广泛应用,文件格式的转换及其后续校验工作变得日益重要。本研究聚焦于探讨标准文档格式转换为Word格式的过程中所面临的挑战,并提出了一个全面的校验流程,以确保转换的准确性和高效性。阐述了标准电子文... 随着标准电子文件在各个领域的广泛应用,文件格式的转换及其后续校验工作变得日益重要。本研究聚焦于探讨标准文档格式转换为Word格式的过程中所面临的挑战,并提出了一个全面的校验流程,以确保转换的准确性和高效性。阐述了标准电子文件在石油等领域的广泛应用以及转换为Word格式的必要性,强调了校验过程的重要性,旨在确保转换后的文件与原始文件在错误率万分之五以内的一致性。 展开更多
关键词 标准行业 标准电子文件转换 word校验 OCR识别 文件质量控制
下载PDF
基于Word Smith软件的典型语料库文体学分析
16
作者 马瑞 马艳 《中阿科技论坛(中英文)》 2024年第7期120-124,共5页
文章运用WordSmith 8.0对艾丽斯·沃克小说《紫色》中的关键词和特殊词簇进行分析,揭示了《紫色》在词汇上的整体分布特征,并指出文中所使用的词汇与句式均与主人公非裔女性这一人物形象相吻合。通过Word Smith 8.0检索发现,沃克小... 文章运用WordSmith 8.0对艾丽斯·沃克小说《紫色》中的关键词和特殊词簇进行分析,揭示了《紫色》在词汇上的整体分布特征,并指出文中所使用的词汇与句式均与主人公非裔女性这一人物形象相吻合。通过Word Smith 8.0检索发现,沃克小说中的关键词和词簇搭配对于促进故事情节和人物刻画方面有重要作用。研究结果表明,语料库文体学有助于学者发现以往研究中忽视的深层文本含义,是对以往《紫色》文学定性研究结果的再次验证,是定性研究和定量研究的积极结合,也是对学界“经典重读”的积极响应。 展开更多
关键词 语料库文体学 艾丽斯·沃克 词簇 《紫色》
下载PDF
“Word绘图+信息检索”在高中地理试题命制中的应用研究
17
作者 王林凤 《地理教学》 北大核心 2024年第18期50-53,共4页
地理图像及图表既是高中地理教学的重要内容和难点,又是高考地理命题的关键。无论是在中学地理教材,还是地理高考题中,地理图像和图表皆占据着极大的比重。图像和图表是地理知识的重要载体,高质量的地理试卷大多以图像为载体,考核学生... 地理图像及图表既是高中地理教学的重要内容和难点,又是高考地理命题的关键。无论是在中学地理教材,还是地理高考题中,地理图像和图表皆占据着极大的比重。图像和图表是地理知识的重要载体,高质量的地理试卷大多以图像为载体,考核学生获取信息和解读信息的能力。在高中地理试题命制的时候,结合“信息检索”“Word绘图”,能够为地理试题的命制带来很大的便利。 展开更多
关键词 地理图像 地理图表 信息检索 word绘图 高中地理
下载PDF
基于Word2vec的二语教学“基本形式库”构建方法初探
18
作者 杨苛鑫 庄会彬 杨牧 《国际汉语教学研究》 2024年第3期76-84,共9页
二语教学中,重视表达取向的“基本形式”观致力于构建一个“基本形式库”。本文以微博语料库为例,将其中高频词设置为检索词,依据Word2vec训练的词向量进行检索,围绕检索词查找近似词来构成(准)等义组,继而进一步确定该组的“基本形式... 二语教学中,重视表达取向的“基本形式”观致力于构建一个“基本形式库”。本文以微博语料库为例,将其中高频词设置为检索词,依据Word2vec训练的词向量进行检索,围绕检索词查找近似词来构成(准)等义组,继而进一步确定该组的“基本形式”。本文初步提出了一种兼具可操作性和效率性的建设方法,作为人工建设“基本形式库”的辅助工具,并检索出了一部分基本形式(准)等义组作为前人研究的补充,为“基本形式”观理论进一步发展提供工具与思考。 展开更多
关键词 基本形式 word2vec 词向量 (准)等义组
原文传递
利用Word VBA辅助书稿编校的研究
19
作者 陈小刚 《新闻研究导刊》 2024年第9期206-210,共5页
VBA是一种面向对象的、可视化的、事件驱动的编程语言,是Windows应用程序通用的宏控制语言,语法较为简单,但它能够在Word、Excel等办公软件中高效地处理一些具有显著特征的、程序性工作。在书稿编校中,不少工作属于具有一定特征的重复... VBA是一种面向对象的、可视化的、事件驱动的编程语言,是Windows应用程序通用的宏控制语言,语法较为简单,但它能够在Word、Excel等办公软件中高效地处理一些具有显著特征的、程序性工作。在书稿编校中,不少工作属于具有一定特征的重复性简单劳动,如文字段落排版、词语查找替换、图表号检查等。如果稿件篇幅较长,仅靠人工逐个处理,工作量大,也非常耗时,而且容易遗漏甚至出现错误。如果此类工作交由Word VBA进行辅助批量处理,则可大幅提高工作效率,有效降低编辑工作错误率。文章首先对Word VBA作简要概述,列出VBA在Office办公软件中的一些用途,并介绍使用方法;接着对VBA中非常重要的、使用较多的正则表达式作简要概述,列举了一些正则表达式匹配实例,并介绍了用于有效测试正则表达式准确性的正则表达式测试工具,以帮助读者更好地编写和测试复杂的正则表达式;然后以文字段落排版、批量替换用词、集中汇总检查序号等为例,具体阐述Word VBA在书稿辅助编校中的应用,同时给出相应程序的核心代码,以供读者参考。文章最后指出,Word VBA在书稿编校中应用广泛,工作中应根据书稿特点编写出通用性较强的程序,并在使用中测试完善,以不断提高书稿编校工作的效率。 展开更多
关键词 word VBA 书稿 编校 排版 替换 匹配
下载PDF
基于决策树算法的Word格式文件数据抽取方法
20
作者 庄自会 《中国新技术新产品》 2024年第14期49-51,共3页
由于Word格式文件数据抽取方法直接对数据自动抽取模型进行构建,没有对数据容量进行自适应处理,因此数据抽取效果较差。本文提出基于决策树算法的Word格式文件数据抽取方法,可对数据容量进行自适应处理,提升数据抽取的效率和准确性。并... 由于Word格式文件数据抽取方法直接对数据自动抽取模型进行构建,没有对数据容量进行自适应处理,因此数据抽取效果较差。本文提出基于决策树算法的Word格式文件数据抽取方法,可对数据容量进行自适应处理,提升数据抽取的效率和准确性。并基于决策树算法构建数据自动抽取模型,输出文件数据抽取策略,进行Word格式文件数据抽取。试验结果表明,该方法提高了抽取效率,降低了系统资源的占用率,从而降低了数据抽取开销。 展开更多
关键词 决策树算法 word格式文件 数据抽取方法 自动化处理
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部