期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
关系数据库中近似重复记录的识别 被引量:7
1
作者 佘春红 许向阳 《计算机应用研究》 CSCD 北大核心 2003年第9期36-39,共4页
数据清理转换是数据仓库中的一个重要研究领域,其技术难点之一是重复记录的识别。介绍了与重复记录识别相关的字符串匹配方法,详细讨论了识别重复记录的分区式优先队列算法、多趟邻近排序法以及邻近连接法,最后给出了实验结果。
关键词 数据清理 重复记录识别 字符串匹配 数据仓库
下载PDF
一种新的XML数据库的索引机制 被引量:2
2
作者 朱虹 童遥 《计算机工程与应用》 CSCD 北大核心 2005年第2期171-172,226,共3页
XML文档的路径查询通常是节点间关系的判断,其中最主要的是祖先、子孙关系的判断。该文通过借鉴R树的构造特点提出了一种新的基于R树的XML数据库的索引机制,解决了快速判断XML文档中节点间祖先、子孙关系的问题。
关键词 XML 数据库 R树 索引
下载PDF
并行数据库PDBMS的物理设计方法
3
作者 许向阳 蔡季萍 张勇 《计算机工程与应用》 CSCD 北大核心 2002年第12期191-192,220,共3页
物理组织结构是并行数据库系统设计的重点,它对提高整个系统的并行化程度和操作效率起着至关重要的作用。文章在分析几种现有的数据划分方法的基础上,提出了一种新型的R-H数据划分方法。文章最后介绍了PDBMS采用的索引结构。
关键词 并行数据库 PDBMS 物理设计方法 数据划分 索引结构 并行B-树
下载PDF
基于LBT树的并行数据库查询优化方法
4
作者 许向阳 高东升 蔡季萍 《小型微型计算机系统》 CSCD 北大核心 2003年第10期1772-1775,共4页
本文提出了一种基于 L BT(L inear- Bushy- Tree)树的查询优化方法 ,它是对基于浓密树 (Bushy- Tree)查询优化方法的一种改进 .这种优化方法大大地缩减了查询执行计划空间 ,确保了并行查询执行计划的优化性 .这种优化方法已经在我们自... 本文提出了一种基于 L BT(L inear- Bushy- Tree)树的查询优化方法 ,它是对基于浓密树 (Bushy- Tree)查询优化方法的一种改进 .这种优化方法大大地缩减了查询执行计划空间 ,确保了并行查询执行计划的优化性 .这种优化方法已经在我们自主研制的并行数据库管理系统 PDBMS[1 ,4 ] 展开更多
关键词 并行数据库 LBT树 并行查询执行计划空间 并行数据库查询优化
下载PDF
DM3故障恢复技术研究
5
作者 冯玉才 何儒汉 朱虹 《计算机应用研究》 CSCD 北大核心 2004年第6期29-31,共3页
故障恢复是DBMS的重要组成部分。提出了一种基于Redo日志、Undo日志和检查点的系统故障恢复技术 ,并详细介绍了它在数据库系统DM3中的设计和实现 ,最后还给出了相应的恢复算法。
关键词 Redo日志 Undo日志 检查点
下载PDF
基于颜色和形状特征的彩色图像表示与检索技术 被引量:15
6
作者 曹奎 冯玉才 曹忠升 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2001年第10期906-911,共6页
提出了一种有效用于抽取特征、索引和检索彩色图像的技术途径 .通过提取图像的颜色不变量 ,建立相应的色度直方图 (hue histogram )来表示图像的颜色分布特征 .为了描述图像中对象的位置及方向特征 ,首先计算图像的色度轮廓并对其进行 R... 提出了一种有效用于抽取特征、索引和检索彩色图像的技术途径 .通过提取图像的颜色不变量 ,建立相应的色度直方图 (hue histogram )来表示图像的颜色分布特征 .为了描述图像中对象的位置及方向特征 ,首先计算图像的色度轮廓并对其进行 Radon变换 ,然后计算相应的“空间直方图”.由此 ,得到了一种基于图像的颜色分布特征和形状特征的新的图像表示方法 .为了计算图像的全局相似度 ,基于“累积距离”和“基于向量的距离”定义了两种图像的距离度量 ,并分别讨论了距离度量的选取与归一化、不同子特征的组合等 CBIR所涉及的关键问题 .实验结果表明 ,文中提出的方法能获得满意的检索性能 。 展开更多
关键词 图像检索 颜色索引 形状索引 直方图 RADON变换 彩色图像表示 图像处理
下载PDF
反编译中的静态库识别研究 被引量:10
7
作者 许向阳 雷涛 朱虹 《计算机工程与应用》 CSCD 北大核心 2004年第9期37-39,共3页
库函数的识别是整个反编译过程的一个重要组成部分。根据可执行程序的静态库的识别过程,该文提出了在这个过程出现的中间代码生成、伪函数模块识别、库函数提取、库函数识别等问题,并给出了对这些问题的解决方法。这些方法在实际的静态... 库函数的识别是整个反编译过程的一个重要组成部分。根据可执行程序的静态库的识别过程,该文提出了在这个过程出现的中间代码生成、伪函数模块识别、库函数提取、库函数识别等问题,并给出了对这些问题的解决方法。这些方法在实际的静态库的识别中得到很好的应用。 展开更多
关键词 反编译 静态库 库函数 伪函数
下载PDF
一种基于颜色的图像表示及全局相似检索技术 被引量:8
8
作者 曹奎 冯玉才 王元珍 《计算机研究与发展》 EI CSCD 北大核心 2001年第9期1121-1126,共6页
基于内容的图像检索是当前图像数据库领域中的一个研究热点 .给出了一种描述图像视觉特征的图像表示方法 ,并据此计算图像之间的全局相似度 .首先 ,通过对彩色空间的分析 ,提取图像中的颜色不变量 ,然后在频域内对这样的颜色信息进行分... 基于内容的图像检索是当前图像数据库领域中的一个研究热点 .给出了一种描述图像视觉特征的图像表示方法 ,并据此计算图像之间的全局相似度 .首先 ,通过对彩色空间的分析 ,提取图像中的颜色不变量 ,然后在频域内对这样的颜色信息进行分析 .对频域分析的结果进行 K- L变换 ,变换后的低维向量即为图像的颜色表示 .在此基础上 ,也讨论了图像的相似度量以及相应的图像检索技术 ,并给出了实验结果和图像检索性能的评价 . 展开更多
关键词 图像数据库 图像表示 全局相似检索 图像处理 计算机
下载PDF
分布式加速事务处理引擎技术及实现 被引量:2
9
作者 李文海 冯玉才 +1 位作者 马晓鸣 周英飙 《计算机工程与设计》 CSCD 北大核心 2008年第3期547-550,共4页
数据库加速引擎是位于企业级数据库应用和数据库服务器之间,使用标准接口与底层数据库服务器通信,采用集群方式实现并行处理而不依赖于集成硬件,具有通用性的软件加速系统,能适应对性能要求较高的OLTP应用。系统采用多个工作线索对数据... 数据库加速引擎是位于企业级数据库应用和数据库服务器之间,使用标准接口与底层数据库服务器通信,采用集群方式实现并行处理而不依赖于集成硬件,具有通用性的软件加速系统,能适应对性能要求较高的OLTP应用。系统采用多个工作线索对数据操作请求进行分发,并利用数据分片技术在子站点上处理操作请求,通过并发控制和一维Hash分片在站点间实现负载平衡。通过测试比较证明,该系统具有高性价比和良好的可扩展性等特点,因而具有广阔的应用前景。 展开更多
关键词 数据库集群 联机事务处理 事务分发 元数据字典 数据分片 线索机制
下载PDF
一种针对时空数据设计的时态索引 被引量:2
10
作者 王元珍 金光 +1 位作者 刘少治 石青青 《计算机工程与应用》 CSCD 北大核心 2002年第23期197-199,共3页
因为时空数据库庞大的体积,索引的搜索效率问题在时空数据库中显得非常重要。虽然前人提出的时态索引结构能够提高搜索效率,然而他们的搜索树都存在重叠问题,严重影响了时空对象的时态搜索效率。针对时空数据库中具有时态特性的时空对象... 因为时空数据库庞大的体积,索引的搜索效率问题在时空数据库中显得非常重要。虽然前人提出的时态索引结构能够提高搜索效率,然而他们的搜索树都存在重叠问题,严重影响了时空对象的时态搜索效率。针对时空数据库中具有时态特性的时空对象,笔者借鉴R+树的原理,在文中提出了一种基于二维时态属性的索引机制—TR+树。它没有重叠问题,相对于前人的研究,TR+树提高了时间检索的性能,并且可以降低时空数据库系统的复杂度。 展开更多
关键词 时空数据 设计 时态索引 时空数据库 时态检索 数据结构 R树 KD树
下载PDF
DM3 EJB容器的安全体系结构的实现技术
11
作者 王元珍 李永波 班鹏新 《计算机工程与应用》 CSCD 北大核心 2004年第9期129-130,193,共3页
安全服务是EJB容器所应提供的一个基本服务。该文为EJB容器设计了一个灵活的、可扩展的安全体系结构。它利用域把EJB容器和安全服务分割开来,不仅可以满足对安全服务的多种要求,还可以透明地添加新的安全服务。
关键词 EJB容器 安全
下载PDF
利用prefix-hash-tree实现从中文文本到事务数据的转换
12
作者 钱铁云 王元珍 冯小年 《计算机科学》 CSCD 北大核心 2005年第5期167-169,184,共4页
电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数... 电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix-hash-tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法都具有较好的效率。 展开更多
关键词 中文文本 HASH 事务 自动文本分类 电子文档 分类方法 文本转换 数据结构 实验证明 重构算法 准确率 结构化 特殊性 结构相 关联
下载PDF
一种基于可扩展散列表的倒排索引更新策略 被引量:6
13
作者 吴恒山 刘兴宇 左琼 《计算机工程》 CAS CSCD 北大核心 2004年第8期83-84,F003,共3页
该文提出一种新的基于可扩展散列表的倒排索引更新策略,使倒排索引具有良好的可扩展性。它既支持文档的插入、删除操作,又具有较高的查询效率和空间利用率。并在它的基础上,实现了倒排索引的增量更新和实时更新。
关键词 全文检索 倒排索引 增量更新 可扩展散列表
下载PDF
结合类频率的关联中文文本分类 被引量:12
14
作者 钱铁云 王元珍 冯小年 《中文信息学报》 CSCD 北大核心 2004年第6期30-36,共7页
该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关... 该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关系。挖掘出的规则用于形成类别特征词的集合 ,可用来和类标号未知文档的词的集合求交集 ,交集元素个数最多者即为所分类别。实验证明 ,该算法在提高训练时间和测试时间的同时具有较好的召回率、准确率和F Measure。 展开更多
关键词 计算机应用 中文信息处理 基于关联的分类 中文文本分类 词类频率 类别特征词集合
下载PDF
超越支持度-置信度框架的负相关对规则挖掘 被引量:6
15
作者 钱铁云 冯小年 王元珍 《计算机科学》 CSCD 北大核心 2005年第10期124-127,163,共5页
相关规则比传统的关联规则更具有实际意义。但现存的相关规则挖掘算法均需利用apriori类似算法挖掘具有高支持度的项集,再对获得的项集进行相关性测试而获取相关规则,这导致低支持度-高相关度的规则不易被发现。直接挖掘相关规则的困难... 相关规则比传统的关联规则更具有实际意义。但现存的相关规则挖掘算法均需利用apriori类似算法挖掘具有高支持度的项集,再对获得的项集进行相关性测试而获取相关规则,这导致低支持度-高相关度的规则不易被发现。直接挖掘相关规则的困难在于候选相关项不能利用apriori类似性质进行剪枝,导致搜索空间爆炸性增长。本文提出的算法MNI利用Phi相关系数的下界来产生候选负相关项,从而缩小负相关项搜索空间,并证明了该算法的完全性和正确性。在负相关项对基础上利用规则可靠度产生负相关规则时,提出将负相关对计数统一转化为正相关对计数的方法。在真实数据集上的实验结果表明,该算法MNI能有效提高负相关项对的挖掘速度。 展开更多
关键词 关联规则 相关规则 Phi相关系数 规则可靠度 规则挖掘 负相关 APRIORI 置信度 挖掘算法 相关规则 框架 搜索空间 实际意义
下载PDF
基于关联规则挖掘的中文文本自动分类 被引量:13
16
作者 王元珍 钱铁云 冯小年 《小型微型计算机系统》 CSCD 北大核心 2005年第8期1380-1383,共4页
随着电子出版物和互联网文档的飞速增加,自动文档分类工作正变得日渐重要.提出一种基于关联规则的中文文本自动分类方法.该算法将文档视作事务,关键词视作项,利用改进的关联规则挖掘算法挖掘项和类别间的相关关系.挖掘出的规则形成分类... 随着电子出版物和互联网文档的飞速增加,自动文档分类工作正变得日渐重要.提出一种基于关联规则的中文文本自动分类方法.该算法将文档视作事务,关键词视作项,利用改进的关联规则挖掘算法挖掘项和类别间的相关关系.挖掘出的规则形成分类器,可用于类标号未知的文档的区分.实验证明,该算法能较快地获得可理解的规则并且具有较好的召回率和准确率. 展开更多
关键词 基于关联的分类 中文文本分类 关联规则挖掘
下载PDF
一种新的基于SOAP的N层WebGIS体系结构 被引量:2
17
作者 冯玉才 时俊普 易宝林 《计算机工程与应用》 CSCD 北大核心 2003年第14期159-160,169,共3页
针对简单对象访问协议(SOAP)和WebGIS的技术特点,分析了将SOAP技术应用于WebGIS的可行性及其优势,在此基础上提出了一种新的基于SOAP技术构建的N层WebGIS体系结构,并对相关问题进行了讨论。
关键词 简单对象访问协议 可扩展标记语言 WEBGIS 体系结构 远程过程调用
下载PDF
近似重复记录的增量式识别算法 被引量:4
18
作者 许向阳 佘春红 《计算机工程与应用》 CSCD 北大核心 2003年第12期191-193,220,共4页
摘要数据清理是数据仓库中的一个重要研究内容,近似重复记录的识别是其中的一个技术难点。文章介绍了近邻排序方法,并以此为基础,研究了在数据模式与匹配规则不变的前提下,数据源动态增加时近似重复记录识别问题,提出了一种增量式算法IM... 摘要数据清理是数据仓库中的一个重要研究内容,近似重复记录的识别是其中的一个技术难点。文章介绍了近邻排序方法,并以此为基础,研究了在数据模式与匹配规则不变的前提下,数据源动态增加时近似重复记录识别问题,提出了一种增量式算法IMPN(IncrementalMulti-Passsorted-Neighborhood)。文章最后给出了实验结果。 展开更多
关键词 数据清理 近似重复记录 增量式识别 特征记录
下载PDF
基于粗集理论的视图分层更新方法 被引量:1
19
作者 李文海 冯玉才 +1 位作者 马晓鸣 尹建章 《计算机科学》 CSCD 北大核心 2008年第1期121-125,共5页
为缩短查询响应时间和提高决策支持能力,数据仓库中存储了大量的实化视图,视图更新成为影响系统整体性能的一个重要因素。本文分析了现有方法处理大规模视图更新的不足,提出一种基于粗集约简发现中间视图依赖层次的方法,利用有效代价确... 为缩短查询响应时间和提高决策支持能力,数据仓库中存储了大量的实化视图,视图更新成为影响系统整体性能的一个重要因素。本文分析了现有方法处理大规模视图更新的不足,提出一种基于粗集约简发现中间视图依赖层次的方法,利用有效代价确定更新次序以达到更新费用最低,随后分析算法的复杂性并通过实验证明其有效性。 展开更多
关键词 数据仓库 实化视图 层次更新 粗集 约简
下载PDF
Linux下网络通信的自调节模型 被引量:1
20
作者 冯玉才 董爱华 周英飙 《计算机应用研究》 CSCD 北大核心 2004年第7期180-181,共2页
在基于C/S模式的数据库管理系统的实现中 ,网络通信部分的性能对整个系统的影响是很大的。在一种基于排队的网络通信模型的基础上提出了一种自调节模型 ,该模型能够自动调节系统的各项参数配置 。
关键词 网络通信 排队模型 自调节 性能
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部