期刊导航
期刊开放获取
重庆大学
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于案例推理和词移距离的复杂产品装配现场技术问题管控方法
被引量:
3
1
作者
宁伟航
刘检华
+2 位作者
熊辉
曹远冲
赵文浩
《计算机集成制造系统》
EI
CSCD
北大核心
2022年第3期663-675,共13页
复杂产品装配过程中的现场技术问题直接影响其装配质量和效率,针对传统管控策略缺乏主动性和预测性等问题,提出了一种基于案例推理和词移距离的装配现场技术问题管控方法。通过对装配工艺设计和车间装配操作执行两阶段的业务流程进行集...
复杂产品装配过程中的现场技术问题直接影响其装配质量和效率,针对传统管控策略缺乏主动性和预测性等问题,提出了一种基于案例推理和词移距离的装配现场技术问题管控方法。通过对装配工艺设计和车间装配操作执行两阶段的业务流程进行集成,实现历史装配工序和现场技术问题的数据融合,并构建案例;在此基础上利用案例推理技术发现新工艺中潜在的问题,并利用改进的词移距离表征文本内容间的语义相似性。通过实例验证了所提方法的有效性和准确性,并开发了装配现场技术问题管控系统,应用于某卫星总装企业,为装配现场技术问题的管控提供了一种新方法。
展开更多
关键词
复杂产品
装配
现场技术问题管控
案例推理
词移距离
下载PDF
职称材料
信息茧房之外:跨媒体视角下用户信息接触的多样性研究
被引量:
3
2
作者
晏齐宏
盖赟
《现代传播(中国传媒大学学报)》
北大核心
2023年第5期76-85,132,共11页
算法推荐会导致信息茧房成为一种“共识”,但用户是积极主动的个体,会进行跨媒体接触。尝试分析用户的跨媒体平台接触,是否以及何种程度上会导致信息接收多样化,并分析信息多样化在用户人口因素、信息偏好、媒体平台使用偏好方面的特征...
算法推荐会导致信息茧房成为一种“共识”,但用户是积极主动的个体,会进行跨媒体接触。尝试分析用户的跨媒体平台接触,是否以及何种程度上会导致信息接收多样化,并分析信息多样化在用户人口因素、信息偏好、媒体平台使用偏好方面的特征。以大学生群体为研究对象,采用日志法追踪用户的多媒介接触行为,并运用词移距离(WMD)测量用户所接触信息之间的语义距离,距离越大,表明所关注信息的相似性越小,接触信息越多样。结果显示,整体上用户关注信息的词移距离处于中等偏低水平,存在弱程度的信息茧房,一定程度上所接收的信息呈现多样化趋势。更进一步,低年级用户、在发达地区读书的用户更可能接触多样化信息。偏好硬新闻的用户,更可能接触多样化信息;相反,偏好正面信息的用户、关注流行信息的用户,更不可能接触多样化信息。偏好使用熟人社交媒体平台的用户、偏好持续而非间歇型媒体使用习惯的用户,越可能接触多样化信息。但用户所接触媒体平台的多样化并不必然带来信息关注的多样化。
展开更多
关键词
信息茧房
信息多样性
跨媒体接触
信息接触
词移距离
下载PDF
职称材料
基于单页语义特征的垃圾网页检测
3
作者
陈木生
高斐
吴俊华
《电子技术应用》
2023年第6期24-29,共6页
为解决垃圾网页检测中特征提取难度高、计算量大的问题,提出一种仅基于当前网页的HTML脚本提取语义特征的方法。首先使用深度优先搜索和动态规划相结合的记忆化搜索算法对域名进行单词切割,采用隐含狄利克雷分布提取主题词,基于Word2Ve...
为解决垃圾网页检测中特征提取难度高、计算量大的问题,提出一种仅基于当前网页的HTML脚本提取语义特征的方法。首先使用深度优先搜索和动态规划相结合的记忆化搜索算法对域名进行单词切割,采用隐含狄利克雷分布提取主题词,基于Word2Vec词向量和词移距离计算3个单页语义相似度特征;然后将单页语义相似度特征融合单页统计特征,使用随机森林等分类算法构建分类模型进行垃圾网页检测。实验结果表明,基于单页内容提取语义特征融合单页统计特征进行分类的AUC值达到88.0%,比对照方法提高4%左右。
展开更多
关键词
垃圾网页检测
特征提取
记忆化搜索
隐含狄利克雷分布
词
向量
词移距离
随机森林
下载PDF
职称材料
多模型加权融合的文本相似度计算
被引量:
6
4
作者
田红鹏
马博
冯健
《计算机工程与设计》
北大核心
2021年第11期3239-3245,共7页
目前传统的文本相似度方法大多数存在未考虑语义及结构信息,容易忽略文本特征细节信息等问题。针对上述问题,提出多模型加权融合的文本相似度计算算法。利用词频、词性、词句位置3个特征共同计算句子相似度;为发现文本的结构信息方面,...
目前传统的文本相似度方法大多数存在未考虑语义及结构信息,容易忽略文本特征细节信息等问题。针对上述问题,提出多模型加权融合的文本相似度计算算法。利用词频、词性、词句位置3个特征共同计算句子相似度;为发现文本的结构信息方面,提出分层池化IIG-SIF用于计算文本的相似程度;结合前两个环节的相似度模型构建一种线性加权模型,汇集两个算法使结果更为精确。实验结果表明,该算法能够提高准确率和召回率,在不同语种和粒度的数据集上均得到更优的实验结果。
展开更多
关键词
文本相似度
特征融合
词移距离
分层池化
句向量
下载PDF
职称材料
基于CWMD和SP的微博话题发现算法
5
作者
孙悦
罗倩
方梁雨
《北京信息科技大学学报(自然科学版)》
2021年第2期76-81,共6页
针对传统微博话题发现算法中,计算文本距离时仅仅考虑词与词的距离和最小而产生的问题,提出了使用CWMD(cos-word mover's distance)作为聚类标准的算法。结合余弦距离和WMD计算句子之间的相似性;使用TF-IDF向量代替WMD中词频权重向...
针对传统微博话题发现算法中,计算文本距离时仅仅考虑词与词的距离和最小而产生的问题,提出了使用CWMD(cos-word mover's distance)作为聚类标准的算法。结合余弦距离和WMD计算句子之间的相似性;使用TF-IDF向量代替WMD中词频权重向量,将所有词对文档的贡献纳入考量;使用CWMD代替传统的距离作为SP(Single-Pass)聚类的标准;并且提出了构建文本待定池的SP算法,旨在避免话题发现过程中数据到达的先后顺序对结果产生的影响,从而提高话题发现的准确性。通过对中文语料数据库中的部分数据进行对比实验,证实了该话题发现模型效果更好。进一步将该模型应用到爬取的微博数据中,将提取的簇的关键词和微博热搜话题进行比对,结果显示二者具有很强的相关性。
展开更多
关键词
词
向量加权
余弦
距离
词移距离
增量聚类
话题发现
下载PDF
职称材料
题名
基于案例推理和词移距离的复杂产品装配现场技术问题管控方法
被引量:
3
1
作者
宁伟航
刘检华
熊辉
曹远冲
赵文浩
机构
北京理工大学机械与车辆学院
上海卫星装备研究所
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2022年第3期663-675,共13页
基金
国家自然科学基金资助项目(51935003)
国防基础科研资助项目(JCKY2016204A502,JCKY2016203B106,JCKY2018206B003)。
文摘
复杂产品装配过程中的现场技术问题直接影响其装配质量和效率,针对传统管控策略缺乏主动性和预测性等问题,提出了一种基于案例推理和词移距离的装配现场技术问题管控方法。通过对装配工艺设计和车间装配操作执行两阶段的业务流程进行集成,实现历史装配工序和现场技术问题的数据融合,并构建案例;在此基础上利用案例推理技术发现新工艺中潜在的问题,并利用改进的词移距离表征文本内容间的语义相似性。通过实例验证了所提方法的有效性和准确性,并开发了装配现场技术问题管控系统,应用于某卫星总装企业,为装配现场技术问题的管控提供了一种新方法。
关键词
复杂产品
装配
现场技术问题管控
案例推理
词移距离
Keywords
complex product
assembly
on-site technical problem control
case-based reasoning
word mover's distance
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
信息茧房之外:跨媒体视角下用户信息接触的多样性研究
被引量:
3
2
作者
晏齐宏
盖赟
机构
北京交通大学语言与传播学院
中国社会科学院大学计算机教研部
出处
《现代传播(中国传媒大学学报)》
北大核心
2023年第5期76-85,132,共11页
基金
国家社科基金项目“智能推荐中算法感知对网络舆论的影响及治理机制研究”(项目编号:21CXW007)的研究成果。
文摘
算法推荐会导致信息茧房成为一种“共识”,但用户是积极主动的个体,会进行跨媒体接触。尝试分析用户的跨媒体平台接触,是否以及何种程度上会导致信息接收多样化,并分析信息多样化在用户人口因素、信息偏好、媒体平台使用偏好方面的特征。以大学生群体为研究对象,采用日志法追踪用户的多媒介接触行为,并运用词移距离(WMD)测量用户所接触信息之间的语义距离,距离越大,表明所关注信息的相似性越小,接触信息越多样。结果显示,整体上用户关注信息的词移距离处于中等偏低水平,存在弱程度的信息茧房,一定程度上所接收的信息呈现多样化趋势。更进一步,低年级用户、在发达地区读书的用户更可能接触多样化信息。偏好硬新闻的用户,更可能接触多样化信息;相反,偏好正面信息的用户、关注流行信息的用户,更不可能接触多样化信息。偏好使用熟人社交媒体平台的用户、偏好持续而非间歇型媒体使用习惯的用户,越可能接触多样化信息。但用户所接触媒体平台的多样化并不必然带来信息关注的多样化。
关键词
信息茧房
信息多样性
跨媒体接触
信息接触
词移距离
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于单页语义特征的垃圾网页检测
3
作者
陈木生
高斐
吴俊华
机构
江西理工大学软件工程学院
南昌市虚拟数字工程与文化传播重点实验室
出处
《电子技术应用》
2023年第6期24-29,共6页
基金
江西省教育厅科学研究项目(GJJ180450)
江西省教育厅科学研究项目(GJJ200839)
江西理工大学博士启动基金(205200100402)。
文摘
为解决垃圾网页检测中特征提取难度高、计算量大的问题,提出一种仅基于当前网页的HTML脚本提取语义特征的方法。首先使用深度优先搜索和动态规划相结合的记忆化搜索算法对域名进行单词切割,采用隐含狄利克雷分布提取主题词,基于Word2Vec词向量和词移距离计算3个单页语义相似度特征;然后将单页语义相似度特征融合单页统计特征,使用随机森林等分类算法构建分类模型进行垃圾网页检测。实验结果表明,基于单页内容提取语义特征融合单页统计特征进行分类的AUC值达到88.0%,比对照方法提高4%左右。
关键词
垃圾网页检测
特征提取
记忆化搜索
隐含狄利克雷分布
词
向量
词移距离
随机森林
Keywords
web spam detection
feature extraction
memory search
latent Dirichlet distribution
Word2Vec
word mover dis‐tance
random forest
分类号
TP391.6 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
多模型加权融合的文本相似度计算
被引量:
6
4
作者
田红鹏
马博
冯健
机构
西安科技大学计算机科学与技术学院
出处
《计算机工程与设计》
北大核心
2021年第11期3239-3245,共7页
基金
陕西省自然科学基础研究计划基金项目(2020JM-533)。
文摘
目前传统的文本相似度方法大多数存在未考虑语义及结构信息,容易忽略文本特征细节信息等问题。针对上述问题,提出多模型加权融合的文本相似度计算算法。利用词频、词性、词句位置3个特征共同计算句子相似度;为发现文本的结构信息方面,提出分层池化IIG-SIF用于计算文本的相似程度;结合前两个环节的相似度模型构建一种线性加权模型,汇集两个算法使结果更为精确。实验结果表明,该算法能够提高准确率和召回率,在不同语种和粒度的数据集上均得到更优的实验结果。
关键词
文本相似度
特征融合
词移距离
分层池化
句向量
Keywords
text similarity
feature fusion
word movement distance
layered pooling
sentence vector
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于CWMD和SP的微博话题发现算法
5
作者
孙悦
罗倩
方梁雨
机构
北京信息科技大学信息与通信工程学院
出处
《北京信息科技大学学报(自然科学版)》
2021年第2期76-81,共6页
基金
中国铁道科学研究院·机车走行部状态监测系统(9151524108)。
文摘
针对传统微博话题发现算法中,计算文本距离时仅仅考虑词与词的距离和最小而产生的问题,提出了使用CWMD(cos-word mover's distance)作为聚类标准的算法。结合余弦距离和WMD计算句子之间的相似性;使用TF-IDF向量代替WMD中词频权重向量,将所有词对文档的贡献纳入考量;使用CWMD代替传统的距离作为SP(Single-Pass)聚类的标准;并且提出了构建文本待定池的SP算法,旨在避免话题发现过程中数据到达的先后顺序对结果产生的影响,从而提高话题发现的准确性。通过对中文语料数据库中的部分数据进行对比实验,证实了该话题发现模型效果更好。进一步将该模型应用到爬取的微博数据中,将提取的簇的关键词和微博热搜话题进行比对,结果显示二者具有很强的相关性。
关键词
词
向量加权
余弦
距离
词移距离
增量聚类
话题发现
Keywords
weighted-word2vec
cosine distance
word mover's distance
text clustering
topic discovery
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于案例推理和词移距离的复杂产品装配现场技术问题管控方法
宁伟航
刘检华
熊辉
曹远冲
赵文浩
《计算机集成制造系统》
EI
CSCD
北大核心
2022
3
下载PDF
职称材料
2
信息茧房之外:跨媒体视角下用户信息接触的多样性研究
晏齐宏
盖赟
《现代传播(中国传媒大学学报)》
北大核心
2023
3
下载PDF
职称材料
3
基于单页语义特征的垃圾网页检测
陈木生
高斐
吴俊华
《电子技术应用》
2023
0
下载PDF
职称材料
4
多模型加权融合的文本相似度计算
田红鹏
马博
冯健
《计算机工程与设计》
北大核心
2021
6
下载PDF
职称材料
5
基于CWMD和SP的微博话题发现算法
孙悦
罗倩
方梁雨
《北京信息科技大学学报(自然科学版)》
2021
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部