期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
网页超链抓取及自动分类技术实现 被引量:4
1
作者 顾潇华 郭军城 《河北大学学报(自然科学版)》 CAS 北大核心 2007年第1期99-102,共4页
为网络环境下个性化信息服务系统实现自动建库功能,提出了一种网络蜘蛛程序的技术方案.该方案使用DELPHI集成开发环境提供的TIdhttp组件抓取网页文本,并利用正则表达式和Mshtml组件从中提取超链信息保存到指定数据库,并能对网页文本进... 为网络环境下个性化信息服务系统实现自动建库功能,提出了一种网络蜘蛛程序的技术方案.该方案使用DELPHI集成开发环境提供的TIdhttp组件抓取网页文本,并利用正则表达式和Mshtml组件从中提取超链信息保存到指定数据库,并能对网页文本进行自动的统计分类. 展开更多
关键词 超链抓取 正则表达式 DELPHI
下载PDF
Web站点的超链结构挖掘 被引量:15
2
作者 阳小华 《计算机工程与应用》 CSCD 北大核心 2001年第8期64-65,共2页
WWW是一个由成千上万个分布在世界各地的Web站点组成的全球信息系统,每个Web站点又是一个由许多Web页构成的信息(子)系统。由于一个文档作者可以通过超链把自己的文档与任意一个已知的Web页链接起来,而一个 Web... WWW是一个由成千上万个分布在世界各地的Web站点组成的全球信息系统,每个Web站点又是一个由许多Web页构成的信息(子)系统。由于一个文档作者可以通过超链把自己的文档与任意一个已知的Web页链接起来,而一个 Web站点上的信息资源又通常是由许多人共同提供的, 因此 Web站点内的超链链接通常是五花八门、各种各样的,它们可以有各种含义和用途。文章分析了WWW系统中超链的使用特征和规律,提出了一个划分超链类型、挖掘站点结构的方法,初步探讨了它在信息收集和查询等方面的应用。 展开更多
关键词 WEB站点 超链结构 数据挖掘 WWW 主页
下载PDF
超链语义分类系统的设计与实现 被引量:1
3
作者 奚伟鹏 李昕 武港山 《计算机应用研究》 CSCD 北大核心 2004年第11期163-167,共5页
提出了一套超链语义分类框架,并详细叙述了其具体实现。该分类系统对反映超链内容语义的各种相关特征进行自动提取以及量化处理,并采用基于决策树的分类方法,使用C4.5机器学习算法,通过对大量人工标注超链样本的学习进行特征优化和选择... 提出了一套超链语义分类框架,并详细叙述了其具体实现。该分类系统对反映超链内容语义的各种相关特征进行自动提取以及量化处理,并采用基于决策树的分类方法,使用C4.5机器学习算法,通过对大量人工标注超链样本的学习进行特征优化和选择,形成分类规则。该分类系统,从超链的语义角度研究了Web中超链的类别,有助于对Web上的资源进行更加有效的自动化处理,并在更深层次上挖掘Web结构信息。 展开更多
关键词 超链 语义 分类 WEB信息挖掘
下载PDF
一种基于数据服务超链进行情景数据集成的方法 被引量:1
4
作者 王桂玲 张峰 韩燕波 《电信科学》 北大核心 2014年第2期51-59,共9页
借鉴Web网页超链的思想,提出利用"数据服务超链"的抽象辅助用户显式地描述数据源之间隐含的关联关系,在此基础上提出基于超链的数据服务即时构造方法,使用户能在进行数据服务导航过程的同时对数据进行即时集成。为了辅助用户... 借鉴Web网页超链的思想,提出利用"数据服务超链"的抽象辅助用户显式地描述数据源之间隐含的关联关系,在此基础上提出基于超链的数据服务即时构造方法,使用户能在进行数据服务导航过程的同时对数据进行即时集成。为了辅助用户在数据服务即时构造过程中进行临机决策,以应对变化的需求,还讨论了一种数据服务超链推荐算法以帮助用户选择合适的数据服务超链。结合案例进行了分析评价及实验,结果表明,本文提出的方法能够有效地支持情景数据集成。 展开更多
关键词 数据服务 服务超链 服务推荐 情景数据集成
下载PDF
浅谈超链挖掘技术在搜索引擎中的应用
5
作者 程晓俊 朱卫平 《福建电脑》 2005年第8期11-12,共2页
本文就互联网中搜索引擎的实现从超链挖掘技术的角度进行一定程度的探讨,并详细阐述了超链挖掘技术在搜索引擎中应用过程及相应方法。
关键词 搜索引擎 挖掘技术 超链 应用过程 互联网
下载PDF
基于聚类的超链路预测 被引量:3
6
作者 齐鹏飞 周丽华 +2 位作者 杜国王 黄皓 黄通 《计算机应用》 CSCD 北大核心 2020年第2期434-440,共7页
超链路预测是利用已观测到网络的特性来复现网络中缺失的链路。现有的超链路预测算法通常利用整个网络来进行预测,预测结果会遗漏训练样本数据较少的链路类别,导致预测种类不够全面。为了解决这个问题,提出了基于聚类的超链路预测算法C-... 超链路预测是利用已观测到网络的特性来复现网络中缺失的链路。现有的超链路预测算法通常利用整个网络来进行预测,预测结果会遗漏训练样本数据较少的链路类别,导致预测种类不够全面。为了解决这个问题,提出了基于聚类的超链路预测算法C-CMM,首先对数据集进行聚类分簇,进而对每一个簇建立模型进行超链路预测。所提算法能够充分利用各个簇的观察样本所蕴含的信息,扩大预测结果覆盖的类别。在三个真实数据集上的实验结果表明,C-CMM和多个先进的链路预测算法相比具有更高的预测精度和效率,同时其预测覆盖种类也更加全面。 展开更多
关键词 信息网络 超链路预测 聚类
下载PDF
基于分块的超链引导的主题搜索改进算法
7
作者 钟佳 王文涛 《中南民族大学学报(自然科学版)》 CAS 2006年第2期84-87,共4页
通过引入“分块”这一新技术,提出了一个改进的H ITS算法,即利用V IPS和分块重要性模型,分割集合中的每一个网页,并为其分配重要值,再结合内容分析法来修改H ITS算法中au thority网页的权值,从而提高搜索精度,使得搜索结果更接近查询者... 通过引入“分块”这一新技术,提出了一个改进的H ITS算法,即利用V IPS和分块重要性模型,分割集合中的每一个网页,并为其分配重要值,再结合内容分析法来修改H ITS算法中au thority网页的权值,从而提高搜索精度,使得搜索结果更接近查询者的意愿. 展开更多
关键词 超链引导的主题搜索 支撑向量机 权威 中枢 重要值
下载PDF
超链路预测 被引量:9
8
作者 刘怡君 唐先一 +2 位作者 李倩倩 马宁 田儒雅 《管理评论》 CSSCI 北大核心 2012年第12期137-145,共9页
超链路预测首次被提出,是指在超网络结构上,对未知的超链接及未来超链接的预测。超链路预测是对现有超网络研究的一项重要推进,实现了对复杂超网络的结构演化、调节干预和预测分析等。本文采用网络结构相似性方法,引入超三角形的概念作... 超链路预测首次被提出,是指在超网络结构上,对未知的超链接及未来超链接的预测。超链路预测是对现有超网络研究的一项重要推进,实现了对复杂超网络的结构演化、调节干预和预测分析等。本文采用网络结构相似性方法,引入超三角形的概念作为相似性的度量指标,提出基于超边相似性的超链路预测算法,并将其应用于实际的舆情超网络模型———钱云会事件中,最后用AUC方法评价超链路预测与链路预测在舆情超网络模型中的优劣。 展开更多
关键词 超网络 超链路预测 超三角形 AUC评价
原文传递
专家知识协作加权超网络模型及其超链路预测研究 被引量:8
9
作者 方哲 游宏梁 +2 位作者 薛非 耿伟波 高强 《科研管理》 CSSCI CSCD 北大核心 2017年第S1期251-258,共8页
针对科技评估及论证实践中专家知识协作网络的特点,提出专家知识协作"领域-专家-知识"三层加权超网络模型,该模型可以准确刻画专家知识协作的领域社区特性和知识协作机理。在此基础上,构建基于加权超边三角形判定的相似性指标... 针对科技评估及论证实践中专家知识协作网络的特点,提出专家知识协作"领域-专家-知识"三层加权超网络模型,该模型可以准确刻画专家知识协作的领域社区特性和知识协作机理。在此基础上,构建基于加权超边三角形判定的相似性指标,提出专家知识协作加权超网络的超链路预测方法。仿真结果表明,本文加权超网络模型及其超链路预测方法,能够更准确地预测专家知识协作网络的链路和演化特征,进而可以为科技工作专家体系设计及治理提供科学评价建议。 展开更多
关键词 专家知识协作 加权超网络 加权超边三角形 超链路预测
原文传递
超图环境下链路预测问题的探究
10
作者 佘美富 王逸伟 +2 位作者 张建章 詹秀秀 刘闯 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第8期61-75,共15页
超图作为图的扩展,可以表示多种实体间的关系,使得其表达能力大大强于图,该优势吸引人们的关注并日益成为研究热点.链路预测作为图数据挖掘中的常见任务,也在超图上扩展为超链路预测.超链路预测通过已知超边或节点的属性来估计新超边出... 超图作为图的扩展,可以表示多种实体间的关系,使得其表达能力大大强于图,该优势吸引人们的关注并日益成为研究热点.链路预测作为图数据挖掘中的常见任务,也在超图上扩展为超链路预测.超链路预测通过已知超边或节点的属性来估计新超边出现的可能性,但是由于超边内节点数量的任意性,其可能的超边由O(n^(2))暴增至O(2^(n)),这大大增加了算法的复杂度.本文使用下采样方法以减少候选超边集的大小,将图上的带重启的随机游走算法扩展到超图上.还将图上的其他指标,如CN、CE、Jaccard等,扩展到超图进行比较.结果表明,带重启的随机游走指标在精确率和召回率上要明显优于其他指标,并且观察到演化良好的超图其超边内部的联系强度随节点数的增加而增加,由此可知超链路预测的主要难点在于对小尺寸超边的预测. 展开更多
关键词 超图 链路预测 超链路预测 带重启的随机游走 有限集合 算法
原文传递
WEB上超文本数据导航方法的研究 被引量:11
11
作者 马瑞民 衣治安 《情报学报》 CSSCI 北大核心 2001年第5期537-544,共8页
迷路问题是超文本数据模型中的主要弊病之一 ,解决该问题需要使用超文本数据的导航方法。本文从超文本数据链接结构的研究出发 ,解释了超文本数据出现迷路的主要原因 ,并对解决Web页面浏览时出现的迷路问题所采用的导航方法进行了综述... 迷路问题是超文本数据模型中的主要弊病之一 ,解决该问题需要使用超文本数据的导航方法。本文从超文本数据链接结构的研究出发 ,解释了超文本数据出现迷路的主要原因 ,并对解决Web页面浏览时出现的迷路问题所采用的导航方法进行了综述与研究 。 展开更多
关键词 超文本/超媒体 迷路问题 导航方法 WEB 超链 页面链接优化 自动超链接技术 导航图
下载PDF
搜索引擎综合分析 被引量:18
12
作者 方志坚 张瑞林 童小素 《计算机工程与设计》 CSCD 北大核心 2007年第16期4038-4041,共4页
随着互联网的广泛应用,搜索引擎成为了越来越多的用户从海量信息中获取知识必不可少的工具。说明了搜索引擎当前发展的现状,简述了搜索引擎的分类,基本原理和工作机制,重点分析了搜索引擎的检索技术及页面排序方法,最后介绍了搜索引擎... 随着互联网的广泛应用,搜索引擎成为了越来越多的用户从海量信息中获取知识必不可少的工具。说明了搜索引擎当前发展的现状,简述了搜索引擎的分类,基本原理和工作机制,重点分析了搜索引擎的检索技术及页面排序方法,最后介绍了搜索引擎面临的挑战和未来发展趋势。 展开更多
关键词 搜索引擎 信息检索 排序算法 链接分析算法 超链引导的主题搜索
下载PDF
一种个性化的主题提取和层次发现算法 被引量:5
13
作者 傅向华 马兆丰 +1 位作者 何明 冯博琴 《西安交通大学学报》 EI CAS CSCD 北大核心 2005年第2期119-122,共4页
从语义相关性角度分析超链归纳主题搜索(HITS) 算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此提出了一种个性化的主题提取和层次发现算法(PTDHE),通过个人查询日志扩展查询词,构造符合用户需要的个性化根集和基础... 从语义相关性角度分析超链归纳主题搜索(HITS) 算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此提出了一种个性化的主题提取和层次发现算法(PTDHE),通过个人查询日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的.PTDHE采用基于最小最大原则的图划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面.在14个查询上的实验结果表明,与HITS算法相比,PTDHE算法不仅可以减少2%~66%的主题漂移率,而且可以发现与查询相关的多个主题. 展开更多
关键词 链接分析 超链归纳主题搜索 主题提取 主题漂移 查询扩展
下载PDF
Web结构分析算法HITS的改进及应用 被引量:5
14
作者 李昕 朱永胜 武港山 《计算机工程》 EI CAS CSCD 北大核心 2005年第6期40-42,83,共4页
在网络环境下,传统检索技术不可避免地存在种种不足,而超链分析技术可以直接或间接地解决这些问题。该文在介绍网络结构的基础上,描述了已有的HITS算法及其改进策略,并提出了该算法的简单实现架构。HITS算法着眼于挖掘超链间的潜在语义... 在网络环境下,传统检索技术不可避免地存在种种不足,而超链分析技术可以直接或间接地解决这些问题。该文在介绍网络结构的基础上,描述了已有的HITS算法及其改进策略,并提出了该算法的简单实现架构。HITS算法着眼于挖掘超链间的潜在语义关系,有助于 在更深层次上挖掘Web中蕴含的语义信息。 展开更多
关键词 WEB 超链 HITS
下载PDF
WEB站点结构优化仿真 被引量:5
15
作者 刘业政 林文龙 +1 位作者 焦宁 姜元春 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第20期4685-4688,共4页
WEB站点结构优化技术是解决WWW浏览中搜寻与获取有益信息的困难问题及信息搜寻行为的效率低下问题的有效方法。基于WEB站点的超链体系结构特征与网页节点的访问频度值特征,建立了一种站点结构优化的数学模型,其目标是使整个站点具有较... WEB站点结构优化技术是解决WWW浏览中搜寻与获取有益信息的困难问题及信息搜寻行为的效率低下问题的有效方法。基于WEB站点的超链体系结构特征与网页节点的访问频度值特征,建立了一种站点结构优化的数学模型,其目标是使整个站点具有较小的平均访问代价。分析了站点超链体系结构特征与节点访问频度特征,采用仿真算法分别模拟了WEB站点的超链体系结构与页面节点的访问频度值,并通过量化新增超链接的影响因素设计了相应的站点结构优化方法。实验结果表明:优化后的站点结构具有较小的平均访问代价。 展开更多
关键词 WEB站点结构优化 超链体系结构 节点访问频度 WEB站点平均访问代价
下载PDF
Web数据挖掘对Web数据检索的支持作用 被引量:4
16
作者 唐建国 胡芒谷 《情报学报》 CSSCI 北大核心 2004年第4期452-455,共4页
本文在对Web数据检索和Web数据挖掘的技术特性进行简要介绍的基础上,阐述了二者之间的主要区别,并着重对Web数据挖掘对Web数据检索构成的支持作用进行了具体分析.这些支持作用体现在:自动分类,揭示知识特征,群集处理,超链结构挖掘和用... 本文在对Web数据检索和Web数据挖掘的技术特性进行简要介绍的基础上,阐述了二者之间的主要区别,并着重对Web数据挖掘对Web数据检索构成的支持作用进行了具体分析.这些支持作用体现在:自动分类,揭示知识特征,群集处理,超链结构挖掘和用户知识模型挖掘. 展开更多
关键词 WEB数据挖掘 Web数据检索 自动分类 超链结构挖掘 知识模型
下载PDF
基于模糊集的主题提取和层次发现算法 被引量:1
17
作者 周红芳 冯博琴 《计算机工程》 CAS CSCD 北大核心 2007年第18期40-41,44,共3页
从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,提出了一种基于模糊集的主题提取和层次发现算法(FSTH),通过用户日志扩展查询词,构造符合用户需要的个性化根集和基础集合,... 从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,提出了一种基于模糊集的主题提取和层次发现算法(FSTH),通过用户日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的。FSTH采用模糊集划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面。在14个查询上的实验结果表明,与HITS算法相比,FSTH算法不仅可以减少7%~53%的主题漂移率,而且可以发现与查询相关的多个主题。 展开更多
关键词 模糊集 超链归纳主题搜索 主题提取 主题漂移 查询扩展
下载PDF
桥函数在统计力学积分方程理论3d-RISM-HNC的应用和溶剂化自由能计算的改进 被引量:1
18
作者 杜奇石 魏冬青 《化学学报》 SCIE CAS CSCD 北大核心 2004年第2期120-126,共7页
把氢 -桥函数和氧 -桥函数应用于统计力学积分方程理论的三维的参考作用点 -超链模型 ( 3d RISM HNC)中 ,用以改进极性和非极性溶质的水溶液的热力学性质的计算 .用三维和二维图形考察了溶剂水分子的氢原子和氧原子的桥函数在改进溶剂... 把氢 -桥函数和氧 -桥函数应用于统计力学积分方程理论的三维的参考作用点 -超链模型 ( 3d RISM HNC)中 ,用以改进极性和非极性溶质的水溶液的热力学性质的计算 .用三维和二维图形考察了溶剂水分子的氢原子和氧原子的桥函数在改进溶剂作用点的平均密度分布函数〈ρH(r)〉和〈ρO(r)〉 ,和平均超额化学势〈Δμ(r)〉的计算的效果 .计算结果表明 ,氢桥函数和氧桥函数极大地改进了 3d RISM HNC方法的精度 ,把这一方法提高到定量和半定量的水平 .研究表明 ,溶质分子的作用点的超额化学势的径向分布函数〈Δμ(r)〉比平均密度分布函数〈ρs(r)〉能够更灵敏地反映桥函数的改进效果 .研究表明 ,为提高 3d RISM HNC方法的精度 。 展开更多
关键词 桥函数 统计力学 积分方程理论 溶剂化自由能 计算精度 改进 超链模型
下载PDF
基于切平面的主题提取算法 被引量:1
19
作者 李芳 柯熙政 《计算机工程与应用》 CSCD 北大核心 2007年第25期172-174,191,共4页
从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此引入局部密集因子LDF(Local Density Factor)的概念。为了解决Web内容的重叠性,基于切平面的概念提出了一种新的主题提... 从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,因此引入局部密集因子LDF(Local Density Factor)的概念。为了解决Web内容的重叠性,基于切平面的概念提出了一种新的主题提取算法(CPTDA)。CPTDA不但可以发现用户最感兴趣的主题页面集合,还可以发现与查询相关的其他页面集合。在10个查询上的实验结果表明,与HITS算法相比,CPTDA算法不仅可以减少30%-52%的主题漂移率,而且可以发现与查询相关的多个主题。 展开更多
关键词 局部密集因子 切平面 超链归纳主题搜索 主题提取 主题漂移
下载PDF
一个自动发现确定主题下资源的系统
20
作者 朱炜 李俊 +1 位作者 王超 潘金贵 《计算机应用研究》 CSCD 北大核心 2004年第11期87-90,共4页
介绍了NDDS(NanDaDolphinSearcher)系统的设计与实现的关键技术。系统使用VSM(VectorSpaceMod el)技术来自动地确定搜索主题。智能Crawler技术能够有目标、有选择地发现新的相关资源。链接分析技术用来分析发现最重要的资源,对资源按重... 介绍了NDDS(NanDaDolphinSearcher)系统的设计与实现的关键技术。系统使用VSM(VectorSpaceMod el)技术来自动地确定搜索主题。智能Crawler技术能够有目标、有选择地发现新的相关资源。链接分析技术用来分析发现最重要的资源,对资源按重要性进行排序。NDDS的两种运行方式分别提供了个性化搜索服务和共享资源服务。 展开更多
关键词 万维网 向量空间模型 超链 智能Crawler 锚文本
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部