期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于案例推理和词移距离的复杂产品装配现场技术问题管控方法 被引量:3
1
作者 宁伟航 刘检华 +2 位作者 熊辉 曹远冲 赵文浩 《计算机集成制造系统》 EI CSCD 北大核心 2022年第3期663-675,共13页
复杂产品装配过程中的现场技术问题直接影响其装配质量和效率,针对传统管控策略缺乏主动性和预测性等问题,提出了一种基于案例推理和词移距离的装配现场技术问题管控方法。通过对装配工艺设计和车间装配操作执行两阶段的业务流程进行集... 复杂产品装配过程中的现场技术问题直接影响其装配质量和效率,针对传统管控策略缺乏主动性和预测性等问题,提出了一种基于案例推理和词移距离的装配现场技术问题管控方法。通过对装配工艺设计和车间装配操作执行两阶段的业务流程进行集成,实现历史装配工序和现场技术问题的数据融合,并构建案例;在此基础上利用案例推理技术发现新工艺中潜在的问题,并利用改进的词移距离表征文本内容间的语义相似性。通过实例验证了所提方法的有效性和准确性,并开发了装配现场技术问题管控系统,应用于某卫星总装企业,为装配现场技术问题的管控提供了一种新方法。 展开更多
关键词 复杂产品 装配 现场技术问题管控 案例推理 词移距离
下载PDF
信息茧房之外:跨媒体视角下用户信息接触的多样性研究 被引量:3
2
作者 晏齐宏 盖赟 《现代传播(中国传媒大学学报)》 北大核心 2023年第5期76-85,132,共11页
算法推荐会导致信息茧房成为一种“共识”,但用户是积极主动的个体,会进行跨媒体接触。尝试分析用户的跨媒体平台接触,是否以及何种程度上会导致信息接收多样化,并分析信息多样化在用户人口因素、信息偏好、媒体平台使用偏好方面的特征... 算法推荐会导致信息茧房成为一种“共识”,但用户是积极主动的个体,会进行跨媒体接触。尝试分析用户的跨媒体平台接触,是否以及何种程度上会导致信息接收多样化,并分析信息多样化在用户人口因素、信息偏好、媒体平台使用偏好方面的特征。以大学生群体为研究对象,采用日志法追踪用户的多媒介接触行为,并运用词移距离(WMD)测量用户所接触信息之间的语义距离,距离越大,表明所关注信息的相似性越小,接触信息越多样。结果显示,整体上用户关注信息的词移距离处于中等偏低水平,存在弱程度的信息茧房,一定程度上所接收的信息呈现多样化趋势。更进一步,低年级用户、在发达地区读书的用户更可能接触多样化信息。偏好硬新闻的用户,更可能接触多样化信息;相反,偏好正面信息的用户、关注流行信息的用户,更不可能接触多样化信息。偏好使用熟人社交媒体平台的用户、偏好持续而非间歇型媒体使用习惯的用户,越可能接触多样化信息。但用户所接触媒体平台的多样化并不必然带来信息关注的多样化。 展开更多
关键词 信息茧房 信息多样性 跨媒体接触 信息接触 词移距离
下载PDF
基于单页语义特征的垃圾网页检测
3
作者 陈木生 高斐 吴俊华 《电子技术应用》 2023年第6期24-29,共6页
为解决垃圾网页检测中特征提取难度高、计算量大的问题,提出一种仅基于当前网页的HTML脚本提取语义特征的方法。首先使用深度优先搜索和动态规划相结合的记忆化搜索算法对域名进行单词切割,采用隐含狄利克雷分布提取主题词,基于Word2Ve... 为解决垃圾网页检测中特征提取难度高、计算量大的问题,提出一种仅基于当前网页的HTML脚本提取语义特征的方法。首先使用深度优先搜索和动态规划相结合的记忆化搜索算法对域名进行单词切割,采用隐含狄利克雷分布提取主题词,基于Word2Vec词向量和词移距离计算3个单页语义相似度特征;然后将单页语义相似度特征融合单页统计特征,使用随机森林等分类算法构建分类模型进行垃圾网页检测。实验结果表明,基于单页内容提取语义特征融合单页统计特征进行分类的AUC值达到88.0%,比对照方法提高4%左右。 展开更多
关键词 垃圾网页检测 特征提取 记忆化搜索 隐含狄利克雷分布 向量 词移距离 随机森林
下载PDF
多模型加权融合的文本相似度计算 被引量:6
4
作者 田红鹏 马博 冯健 《计算机工程与设计》 北大核心 2021年第11期3239-3245,共7页
目前传统的文本相似度方法大多数存在未考虑语义及结构信息,容易忽略文本特征细节信息等问题。针对上述问题,提出多模型加权融合的文本相似度计算算法。利用词频、词性、词句位置3个特征共同计算句子相似度;为发现文本的结构信息方面,... 目前传统的文本相似度方法大多数存在未考虑语义及结构信息,容易忽略文本特征细节信息等问题。针对上述问题,提出多模型加权融合的文本相似度计算算法。利用词频、词性、词句位置3个特征共同计算句子相似度;为发现文本的结构信息方面,提出分层池化IIG-SIF用于计算文本的相似程度;结合前两个环节的相似度模型构建一种线性加权模型,汇集两个算法使结果更为精确。实验结果表明,该算法能够提高准确率和召回率,在不同语种和粒度的数据集上均得到更优的实验结果。 展开更多
关键词 文本相似度 特征融合 词移距离 分层池化 句向量
下载PDF
基于CWMD和SP的微博话题发现算法
5
作者 孙悦 罗倩 方梁雨 《北京信息科技大学学报(自然科学版)》 2021年第2期76-81,共6页
针对传统微博话题发现算法中,计算文本距离时仅仅考虑词与词的距离和最小而产生的问题,提出了使用CWMD(cos-word mover's distance)作为聚类标准的算法。结合余弦距离和WMD计算句子之间的相似性;使用TF-IDF向量代替WMD中词频权重向... 针对传统微博话题发现算法中,计算文本距离时仅仅考虑词与词的距离和最小而产生的问题,提出了使用CWMD(cos-word mover's distance)作为聚类标准的算法。结合余弦距离和WMD计算句子之间的相似性;使用TF-IDF向量代替WMD中词频权重向量,将所有词对文档的贡献纳入考量;使用CWMD代替传统的距离作为SP(Single-Pass)聚类的标准;并且提出了构建文本待定池的SP算法,旨在避免话题发现过程中数据到达的先后顺序对结果产生的影响,从而提高话题发现的准确性。通过对中文语料数据库中的部分数据进行对比实验,证实了该话题发现模型效果更好。进一步将该模型应用到爬取的微博数据中,将提取的簇的关键词和微博热搜话题进行比对,结果显示二者具有很强的相关性。 展开更多
关键词 向量加权 余弦距离 词移距离 增量聚类 话题发现
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部