期刊文献+
共找到1,175篇文章
< 1 2 59 >
每页显示 20 50 100
Orbit Weighting Scheme in the Context of Vector Space Information Retrieval
1
作者 Ahmad Ababneh Yousef Sanjalawe +2 位作者 Salam Fraihat Salam Al-E’mari Hamzah Alqudah 《Computers, Materials & Continua》 SCIE EI 2024年第7期1347-1379,共33页
This study introduces the Orbit Weighting Scheme(OWS),a novel approach aimed at enhancing the precision and efficiency of Vector Space information retrieval(IR)models,which have traditionally relied on weighting schem... This study introduces the Orbit Weighting Scheme(OWS),a novel approach aimed at enhancing the precision and efficiency of Vector Space information retrieval(IR)models,which have traditionally relied on weighting schemes like tf-idf and BM25.These conventional methods often struggle with accurately capturing document relevance,leading to inefficiencies in both retrieval performance and index size management.OWS proposes a dynamic weighting mechanism that evaluates the significance of terms based on their orbital position within the vector space,emphasizing term relationships and distribution patterns overlooked by existing models.Our research focuses on evaluating OWS’s impact on model accuracy using Information Retrieval metrics like Recall,Precision,InterpolatedAverage Precision(IAP),andMeanAverage Precision(MAP).Additionally,we assessOWS’s effectiveness in reducing the inverted index size,crucial for model efficiency.We compare OWS-based retrieval models against others using different schemes,including tf-idf variations and BM25Delta.Results reveal OWS’s superiority,achieving a 54%Recall and 81%MAP,and a notable 38%reduction in the inverted index size.This highlights OWS’s potential in optimizing retrieval processes and underscores the need for further research in this underrepresented area to fully leverage OWS’s capabilities in information retrieval methodologies. 展开更多
关键词 Information retrieval orbit weighting scheme semantic text analysis Tf-Idf weighting scheme vector space model
下载PDF
Indirect Vector Control of Linear Induction Motors Using Space Vector Pulse Width Modulation 被引量:1
2
作者 Arjmand Khaliq Syed Abdul Rahman Kashif +5 位作者 Fahad Ahmad Muhammad Anwar Qaisar Shaheen Rizwan Akhtar Muhammad Arif Shah Abdelzahir Abdelmaboud 《Computers, Materials & Continua》 SCIE EI 2023年第3期6263-6287,共25页
Vector control schemes have recently been used to drive linear induction motors(LIM)in high-performance applications.This trend promotes the development of precise and efficient control schemes for individual motors.T... Vector control schemes have recently been used to drive linear induction motors(LIM)in high-performance applications.This trend promotes the development of precise and efficient control schemes for individual motors.This research aims to present a novel framework for speed and thrust force control of LIM using space vector pulse width modulation(SVPWM)inverters.The framework under consideration is developed in four stages.To begin,MATLAB Simulink was used to develop a detailed mathematical and electromechanical dynamicmodel.The research presents a modified SVPWM inverter control scheme.By tuning the proportional-integral(PI)controller with a transfer function,optimized values for the PI controller are derived.All the subsystems mentioned above are integrated to create a robust simulation of the LIM’s precise speed and thrust force control scheme.The reference speed values were chosen to evaluate the performance of the respective system,and the developed system’s response was verified using various data sets.For the low-speed range,a reference value of 10m/s is used,while a reference value of 100 m/s is used for the high-speed range.The speed output response indicates that themotor reached reference speed in amatter of seconds,as the delay time is between 8 and 10 s.The maximum amplitude of thrust achieved is less than 400N,demonstrating the controller’s capability to control a high-speed LIM with minimal thrust ripple.Due to the controlled speed range,the developed system is highly recommended for low-speed and high-speed and heavy-duty traction applications. 展开更多
关键词 space vector pulse width modulation linear induction motor proportional-integral controller indirect vector control electromechanical dynamic modeling
下载PDF
基于VSM与HITS融合的扩展主题型爬虫
3
作者 陶飞飞 徐佳 +1 位作者 徐松阳 唐明伟 《计算机仿真》 2024年第10期222-226,共5页
目前主流开源爬虫框架在分析页面与主题领域关联性上,常采用基于关键词的量化和向量空间模型算法相融合,但融合疏忽了界面语义与特定主题间的关联,导致爬取内容与主题产生偏差。为了给金融等领域的舆情分析提供准确的数据支撑,提出一种... 目前主流开源爬虫框架在分析页面与主题领域关联性上,常采用基于关键词的量化和向量空间模型算法相融合,但融合疏忽了界面语义与特定主题间的关联,导致爬取内容与主题产生偏差。为了给金融等领域的舆情分析提供准确的数据支撑,提出一种面向领域扩展主题库的爬虫及系统,通过扩展主题特征库,融合向量空间模型(Vector Space Model,VSM)与超链接主题搜索算法(Hyperlink-Induced Topic Search,HITS),优化了主题页面相关度计算,并针对股票舆情信息爬取进行仿真。结果表明,上述扩展主题型爬虫在爬取准确率和效率等方面有较好地提升,能够有效地完成领域主题信息的爬取任务。 展开更多
关键词 扩展主题爬虫 向量空间模型 超链接主题搜索 股票舆情信息
下载PDF
Research on Dynamic Discovery Model of User Interest Based on Time and Space Vector
4
作者 Jinxiu Lin Zhaoxin Zhang +1 位作者 Lejun Chi Yang Wang 《国际计算机前沿大会会议论文集》 2018年第2期7-7,共1页
关键词 USER INTEREST model vsm Time and space vector
下载PDF
Evaluation of Modified Vector Space Representation Using ADFA-LD and ADFA-WD Datasets 被引量:3
5
作者 Bhavesh Borisaniya Dhiren Patel 《Journal of Information Security》 2015年第3期250-264,共15页
Predicting anomalous behaviour of a running process using system call trace is a common practice among security community and it is still an active research area. It is a typical pattern recognition problem and can be... Predicting anomalous behaviour of a running process using system call trace is a common practice among security community and it is still an active research area. It is a typical pattern recognition problem and can be dealt with machine learning algorithms. Standard system call datasets were employed to train these algorithms. However, advancements in operating systems made these datasets outdated and un-relevant. Australian Defence Force Academy Linux Dataset (ADFA-LD) and Australian Defence Force Academy Windows Dataset (ADFA-WD) are new generation system calls datasets that contain labelled system call traces for modern exploits and attacks on various applications. In this paper, we evaluate performance of Modified Vector Space Representation technique on ADFA-LD and ADFA-WD datasets using various classification algorithms. Our experimental results show that our method performs well and it helps accurately distinguishing process behaviour through system calls. 展开更多
关键词 System Call Trace vector space model MODIFIED vector space REPRESENTATION ADFA-LD ADFA-WD
下载PDF
Word Embeddings and Semantic Spaces in Natural Language Processing 被引量:1
6
作者 Peter J. Worth 《International Journal of Intelligence Science》 2023年第1期1-21,共21页
One of the critical hurdles, and breakthroughs, in the field of Natural Language Processing (NLP) in the last two decades has been the development of techniques for text representation that solves the so-called curse ... One of the critical hurdles, and breakthroughs, in the field of Natural Language Processing (NLP) in the last two decades has been the development of techniques for text representation that solves the so-called curse of dimensionality, a problem which plagues NLP in general given that the feature set for learning starts as a function of the size of the language in question, upwards of hundreds of thousands of terms typically. As such, much of the research and development in NLP in the last two decades has been in finding and optimizing solutions to this problem, to feature selection in NLP effectively. This paper looks at the development of these various techniques, leveraging a variety of statistical methods which rest on linguistic theories that were advanced in the middle of the last century, namely the distributional hypothesis which suggests that words that are found in similar contexts generally have similar meanings. In this survey paper we look at the development of some of the most popular of these techniques from a mathematical as well as data structure perspective, from Latent Semantic Analysis to Vector Space Models to their more modern variants which are typically referred to as word embeddings. In this review of algoriths such as Word2Vec, GloVe, ELMo and BERT, we explore the idea of semantic spaces more generally beyond applicability to NLP. 展开更多
关键词 Natural Language Processing vector space models Semantic spaces Word Embeddings Representation Learning Text vectorization Machine Learning Deep Learning
下载PDF
Groove modeling and digital simulation for intersecting structures of circular tubes based on coplanarity of vectors
7
作者 Chen Changrong Zhou Sunsheng +3 位作者 Lian Guofu Huang Xu Feng Meiyan Gao Xianfeng 《China Welding》 CAS 2022年第2期29-38,共10页
In order to establish the groove model for intersecting structures of circular tubes,mathematical model of the intersecting line is established by the method of analytic geometry,and parametric equations are thus dete... In order to establish the groove model for intersecting structures of circular tubes,mathematical model of the intersecting line is established by the method of analytic geometry,and parametric equations are thus determined.The dihedral angle,groove angle and actual cutting angle for any position of the intersecting line are derived as well.In order to identify groove vectors for two pipes,a new analytical method,i.e.coplanarity of vectors,is further proposed to complete the groove model.The established model is virtually verified by programming and simulation calculation in the MATLAB environment.The results show that groove vectors of intersecting structures simulated by MATLAB are consistent with the theoretical groove model,indicating that the theoretical groove model established in this paper is accurate,and further proves that the proposed coplanarity of vectors for solving groove vectors is correct and feasible.Finally,a graphical user interface(GUI)is developed by MATLAB software to independently realize functions such as model drawing,variable calculation and data output.The research outcome provides a theoretical foundation for the actual welding of circular intersecting structures,and lays an essential basis for weld bead layout and path planning. 展开更多
关键词 method of analytic geometry in space intersecting line mathematical model coplanarity of vectors groove model MATLAB simulation
下载PDF
基于VSM的电子作业反抄袭系统的设计与实现 被引量:2
8
作者 周小平 王佳 马晓轩 《实验技术与管理》 CAS 北大核心 2013年第3期109-111,共3页
针对日益严重的电子作业抄袭现象,在分析目前的电子作业抄袭检测系统无法将抄袭作业拒绝于提交之前等问题的基础上,阐述了一套基于空间向量模型TF-IDF方法的电子作业反抄袭系统。该系统在对电子作业进行分词的基础上,使用空间向量模型的... 针对日益严重的电子作业抄袭现象,在分析目前的电子作业抄袭检测系统无法将抄袭作业拒绝于提交之前等问题的基础上,阐述了一套基于空间向量模型TF-IDF方法的电子作业反抄袭系统。该系统在对电子作业进行分词的基础上,使用空间向量模型的TF-IDF方法计算文本相似度,并依据相似度判断电子作业是否有抄袭行为。为了解决因短时间内大量的电子作业提交而导致系统崩溃,系统使用MSMQ建立电子作业提交队列,同时,系统还提供了电子作业评阅及系统设置等功能。系统使用时间优先策略来认定抄袭作业,有效地从抄袭者和被抄袭者上杜绝了抄袭行为。 展开更多
关键词 电子作业反抄袭系统 抄袭检测 文本相似度 向量空间模型
下载PDF
VSM模型在文档结构识别中的应用 被引量:10
9
作者 宋昊苏 李宁 张伟 《北京信息科技大学学报(自然科学版)》 2011年第6期66-69,75,共5页
借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计... 借鉴向量空间模型(VSM),将文档的单元结构映射到特征向量,并对其进行归一化和加权处理,再计算标准文档结构分类特征向量和待查文档单元结构特征向量的相似度,实现对文档结构的识别。测试结果表明,该方法实现了文档格式的向量表示,易于计算,具有较好的扩展性,可在此基础上实现其他特定结构文档格式的自动检查或文档理解。 展开更多
关键词 文档结构识别 向量空间模型 文档格式校验 文档理解
下载PDF
基于VSM的文本相似度计算的研究 被引量:101
10
作者 郭庆琳 李艳梅 唐琦 《计算机应用研究》 CSCD 北大核心 2008年第11期3256-3258,共3页
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词... 文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TD-IDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。 展开更多
关键词 文本相似度 特征选择 词频—逆文档频率法 向量空间模型
下载PDF
基于SPI与VSM的Web访问控制与过滤系统的研究与设计 被引量:1
11
作者 陈世强 贺刚 谢坤武 《计算机应用与软件》 CSCD 2009年第7期126-128,共3页
对用户请求的Web文本信息进行实时控制与过滤是信息安全的一个重要研究分支。基于Winsock SPI技术实现了一个Web访问控制与过滤系统。系统利用VSM模型计算网页间的相似度,采用URL规则和Web页内容审计的混合策略进行过滤。系统既能过滤新... 对用户请求的Web文本信息进行实时控制与过滤是信息安全的一个重要研究分支。基于Winsock SPI技术实现了一个Web访问控制与过滤系统。系统利用VSM模型计算网页间的相似度,采用URL规则和Web页内容审计的混合策略进行过滤。系统既能过滤新Web页,又能自动维护URL规则库,经多次测试效果良好。 展开更多
关键词 信息过滤 SPI 向量空间模型 相似度
下载PDF
改进的VSM算法及其在FAQ中的应用 被引量:9
12
作者 郑诚 李清 刘福君 《计算机工程》 CAS CSCD 2012年第17期201-204,共4页
现有的句子相似度算法的准确率较低。为此,提出一种改进的向量空间模型算法。在传统的向量空间模型中添加语义信息和句法信息,将其运用到句子相似度计算中,设计实现金融领域的FAQ自动问答系统,通过改进算法在FAQ中进行句子相似度计算,... 现有的句子相似度算法的准确率较低。为此,提出一种改进的向量空间模型算法。在传统的向量空间模型中添加语义信息和句法信息,将其运用到句子相似度计算中,设计实现金融领域的FAQ自动问答系统,通过改进算法在FAQ中进行句子相似度计算,获取用户问题的答案。实验结果证明,该算法具有较高的准确率。 展开更多
关键词 句子相似度 向量空间模型 自动问答系统 索引 分词
下载PDF
基于多约简Fisher-VSM和SVM的文本情感分类 被引量:1
13
作者 邢玉娟 谭萍 曹晓丽 《计算机应用与软件》 CSCD 2016年第9期301-305,共5页
为了提高文本情感分类准确率,提出基于多约简Fisher向量空间模型和支持向量机的文本情感分类算法。该算法首先采用Fisher判别准则提取TF-IDF特征向量,然后依据低维文档向量空间模型间的相似度对文档进行聚类,减少文档的数目。该算法从... 为了提高文本情感分类准确率,提出基于多约简Fisher向量空间模型和支持向量机的文本情感分类算法。该算法首先采用Fisher判别准则提取TF-IDF特征向量,然后依据低维文档向量空间模型间的相似度对文档进行聚类,减少文档的数目。该算法从维度和数量两个方面对文档的向量空间模型进行约简,以期提高支持向量机的训练速度和分类性能。仿真实验结果表明,该算法具有良好的召回率和分类准确率。 展开更多
关键词 文本情感分类 Fisher判别比 向量空间模型 支持向量机
下载PDF
基于VSM的分层网页推荐算法 被引量:5
14
作者 邵华 高凤荣 +1 位作者 邢春晓 蒋丽华 《计算机科学》 CSCD 北大核心 2006年第11期86-88,105,共4页
在面对大数据量时,传统的基于VSM的分层网页推荐算法由于分类的不准确,造成推荐精确率较低。该文针对这个缺陷提出了改进的分层推荐算法,该算法在推荐过程中综合考虑了领域和用户兴趣,以及网页和用户兴趣的相似程度,来为用户提供高效的... 在面对大数据量时,传统的基于VSM的分层网页推荐算法由于分类的不准确,造成推荐精确率较低。该文针对这个缺陷提出了改进的分层推荐算法,该算法在推荐过程中综合考虑了领域和用户兴趣,以及网页和用户兴趣的相似程度,来为用户提供高效的个性化网页推荐。实验表明,该算法提高了网页推荐的精确率。 展开更多
关键词 个性化 向量空间模型 层次 推荐算法
下载PDF
一种基于VSM文本分类系统的设计与实现 被引量:19
15
作者 李凡 林爱武 陈国社 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第3期53-55,共3页
阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现 ,包括对该系统的结构、预处理、特征提取、训练算法 ,分类算法等关键技术的介绍 .通过引入结构层次权重系数来改进文本特征项权重 ,同时提出一种新的训练算法和文本相似... 阐述了一个基于改进向量空间模型的中文文本分类系统的设计与实现 ,包括对该系统的结构、预处理、特征提取、训练算法 ,分类算法等关键技术的介绍 .通过引入结构层次权重系数来改进文本特征项权重 ,同时提出一种新的训练算法和文本相似度域值计算方法 .实验结果证明 :该分类系统能有效地提高文本分类效果 ,开放性测试的平均准确率在 80 %以上 ,且平均查全率达到了 86 % . 展开更多
关键词 文本分类 向量空间模型 特征提取 结构层次权重系数 训练算法 分类算法
下载PDF
VSM在中文文本聚类中的应用及实证分析 被引量:13
16
作者 马辉民 李卫华 吴良元 《武汉理工大学学报(信息与管理工程版)》 CAS 2006年第4期56-59,81,共5页
文本聚类是W eb文本挖掘的一个重要分支,而文本表示方法是文本聚类的基础。重点讨论了文本表示方法中最常用到的向量空间模型,分析了其优势和不足,并基于一个文本处理实验,对V SM模型从可实现角度给出改进建议。
关键词 文本聚类 向量空间模型 文本表示
下载PDF
基于依存连接权VSM的子话题检测与跟踪方法 被引量:10
17
作者 周学广 高飞 孙艳 《通信学报》 EI CSCD 北大核心 2013年第8期1-9,共9页
针对在新闻话题中报道突发、热点相似且子话题层次丰富的现象,依据增量TF-IDF值构造特征维,生成全局向量;然后在时间窗内生成特征连接权的局部邻接图,利用依存句法进行分析降维;最后采用领域词典加权,时间阈值衰减;从而构造出利用依存... 针对在新闻话题中报道突发、热点相似且子话题层次丰富的现象,依据增量TF-IDF值构造特征维,生成全局向量;然后在时间窗内生成特征连接权的局部邻接图,利用依存句法进行分析降维;最后采用领域词典加权,时间阈值衰减;从而构造出利用依存连接权VSM进行关联分析的子话题检测与跟踪(sTDT)计算方法。实验表明,利用依存关联分析使文本表示由线性变为平面结构,能够有效地提取描述子话题;在人工标注的测试语料下,其最小DET代价比经典方法至少降低2.2%。 展开更多
关键词 话题检测与跟踪 依存连接权 关联词对 报道关系检测 向量空间模型
下载PDF
基于VSM的科技期刊文献与专利文献的相似度计算方法研究 被引量:10
18
作者 曾文 徐红姣 +2 位作者 李颖 王莉军 赵婧 《情报工程》 2016年第3期37-42,共6页
文本相似度的计算方法以采用TF-IDF的方法对文本建模成词频向量空间模型(VSM)为主,本文结合科技期刊文献和专利文献特点,对TF-IDF的计算方法进行了改进,将词频的统计改进为科技术语的频率统计,提出了一种针对科技文献相似度的计算方法,... 文本相似度的计算方法以采用TF-IDF的方法对文本建模成词频向量空间模型(VSM)为主,本文结合科技期刊文献和专利文献特点,对TF-IDF的计算方法进行了改进,将词频的统计改进为科技术语的频率统计,提出了一种针对科技文献相似度的计算方法,该方法首先应用自然语言处理技术对科技文献进行预处理,采用科技术语的自动抽取方法进行科技文献术语的自动抽取,结合该文提出的术语权重计算公式构建向量空间模型,来计算科技期刊文献和专利文献之间的相似度。并利用真实有效的科学期刊和文献数据进行实验测试,实验结果表明文中提出的方法优于传统的TF-IDF计算方法。 展开更多
关键词 自然语言处理 TF—IDF 向量空间模型 科技期刊 专利 相似度
下载PDF
基于本体的VSM在兴趣型学习社区分组中的应用 被引量:2
19
作者 程艳 许维胜 +1 位作者 赵斐 何一文 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第5期736-743,共8页
采用语义网络技术,提出了基于本体的向量空间模型(VSM),计算学习者的兴趣向量,克服了传统的VSM有术语间语义相关性被忽略的不足,提高了兴趣相似性比较的精确程度,同时提出了一种基于学习者兴趣相似匹配度和学习者兴趣匹配浓度的学习社... 采用语义网络技术,提出了基于本体的向量空间模型(VSM),计算学习者的兴趣向量,克服了传统的VSM有术语间语义相关性被忽略的不足,提高了兴趣相似性比较的精确程度,同时提出了一种基于学习者兴趣相似匹配度和学习者兴趣匹配浓度的学习社区自组织分组算法.针对模型使用本体中的概念构造向量空间表现出的巨大维数,运用概念索引降维法对兴趣特征矩阵进行合理降维,大大降低了计算的复杂性.最后通过应用案例验证分析了该模型算法具有较高的分组效率和良好的扩展性. 展开更多
关键词 分组算法 本体 兴趣特征 向量空间模型 概念索引法
下载PDF
基于VSM的权重改进文档相似度算法研究 被引量:9
20
作者 韩如冰 叶得学 《软件》 2012年第10期103-105,共3页
向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索的效果起着决定性的作用。文中提出了一个基于关键词的权重改进传统向量空间模型的权重算法。基于改进索引项权重的向量空间模型除了考虑原有索引项权重还考虑了文... 向量空间模型是以索引项权重为核心的模型,索引项权重对文本分类、检索的效果起着决定性的作用。文中提出了一个基于关键词的权重改进传统向量空间模型的权重算法。基于改进索引项权重的向量空间模型除了考虑原有索引项权重还考虑了文档中关键词的权重。通过特定领域FAQ的检索测试结果表明,改进的算法很大程度上提高了检索的查准率、查全率。 展开更多
关键词 向量空间模型 关键词权重 查准率 查全率
下载PDF
上一页 1 2 59 下一页 到第
使用帮助 返回顶部