期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
关系数据库中近似重复记录的识别 被引量:7
1
作者 佘春红 许向阳 《计算机应用研究》 CSCD 北大核心 2003年第9期36-39,共4页
数据清理转换是数据仓库中的一个重要研究领域,其技术难点之一是重复记录的识别。介绍了与重复记录识别相关的字符串匹配方法,详细讨论了识别重复记录的分区式优先队列算法、多趟邻近排序法以及邻近连接法,最后给出了实验结果。
关键词 数据清理 重复记录识别 字符串匹配 数据仓库
下载PDF
一种新的XML数据库的索引机制 被引量:2
2
作者 朱虹 童遥 《计算机工程与应用》 CSCD 北大核心 2005年第2期171-172,226,共3页
XML文档的路径查询通常是节点间关系的判断,其中最主要的是祖先、子孙关系的判断。该文通过借鉴R树的构造特点提出了一种新的基于R树的XML数据库的索引机制,解决了快速判断XML文档中节点间祖先、子孙关系的问题。
关键词 XML 数据库 R树 索引
下载PDF
基于移动Agent的分布式数据库的研究 被引量:6
3
作者 谭支鹏 《小型微型计算机系统》 CSCD 北大核心 2001年第7期868-870,共3页
本文对移动 Agent技术进行了系统地概述和探讨 .提出把移动 Agent技术应用于分布式数据库系统中 ,并给出了在分布式数据库系统中利用移动 Agent技术实现并发控制和分布式查询的方法 .
关键词 分布式数据库 分布式查询 并发控制 移动AGENT 人工智能
下载PDF
并行数据库PDBMS的物理设计方法
4
作者 许向阳 蔡季萍 张勇 《计算机工程与应用》 CSCD 北大核心 2002年第12期191-192,220,共3页
物理组织结构是并行数据库系统设计的重点,它对提高整个系统的并行化程度和操作效率起着至关重要的作用。文章在分析几种现有的数据划分方法的基础上,提出了一种新型的R-H数据划分方法。文章最后介绍了PDBMS采用的索引结构。
关键词 并行数据库 PDBMS 物理设计方法 数据划分 索引结构 并行B-树
下载PDF
基于LBT树的并行数据库查询优化方法
5
作者 许向阳 高东升 蔡季萍 《小型微型计算机系统》 CSCD 北大核心 2003年第10期1772-1775,共4页
本文提出了一种基于 L BT(L inear- Bushy- Tree)树的查询优化方法 ,它是对基于浓密树 (Bushy- Tree)查询优化方法的一种改进 .这种优化方法大大地缩减了查询执行计划空间 ,确保了并行查询执行计划的优化性 .这种优化方法已经在我们自... 本文提出了一种基于 L BT(L inear- Bushy- Tree)树的查询优化方法 ,它是对基于浓密树 (Bushy- Tree)查询优化方法的一种改进 .这种优化方法大大地缩减了查询执行计划空间 ,确保了并行查询执行计划的优化性 .这种优化方法已经在我们自主研制的并行数据库管理系统 PDBMS[1 ,4 ] 展开更多
关键词 并行数据库 LBT树 并行查询执行计划空间 并行数据库查询优化
下载PDF
多媒体查询语言及其评价准则 被引量:2
6
作者 曹忠升 吴宗大 王元珍 《计算机科学》 CSCD 北大核心 2009年第3期9-13,25,共6页
随着多媒体技术和多媒体相关应用的发展,对有效检索多媒体信息的要求越来越迫切。查询语言作为信息检索的有效工具,其研究也越来越受到关注。对现有的多媒体查询语言进行了全面的综述,将它们分为两类:专用语言和通用语言。尽管查询语言... 随着多媒体技术和多媒体相关应用的发展,对有效检索多媒体信息的要求越来越迫切。查询语言作为信息检索的有效工具,其研究也越来越受到关注。对现有的多媒体查询语言进行了全面的综述,将它们分为两类:专用语言和通用语言。尽管查询语言对多媒体信息系统提供有效的查询服务至关重要,但目前仍没有较好的多媒体查询语言评价准则。因此,针对多媒体查询语言的查询表达能力设计准则共16条,并根据这些准则对多媒体查询语言进行了评价。评价结果表明,这些语言能满足用户的基本查询要求,但在高级语义查询和不确定查询等方面还有欠缺。最后展望了多媒体查询语言的未来研究方向。 展开更多
关键词 多媒体信息检索 查询语言 评价准则
下载PDF
一种针对时空数据设计的时态索引 被引量:2
7
作者 王元珍 金光 +1 位作者 刘少治 石青青 《计算机工程与应用》 CSCD 北大核心 2002年第23期197-199,共3页
因为时空数据库庞大的体积,索引的搜索效率问题在时空数据库中显得非常重要。虽然前人提出的时态索引结构能够提高搜索效率,然而他们的搜索树都存在重叠问题,严重影响了时空对象的时态搜索效率。针对时空数据库中具有时态特性的时空对象... 因为时空数据库庞大的体积,索引的搜索效率问题在时空数据库中显得非常重要。虽然前人提出的时态索引结构能够提高搜索效率,然而他们的搜索树都存在重叠问题,严重影响了时空对象的时态搜索效率。针对时空数据库中具有时态特性的时空对象,笔者借鉴R+树的原理,在文中提出了一种基于二维时态属性的索引机制—TR+树。它没有重叠问题,相对于前人的研究,TR+树提高了时间检索的性能,并且可以降低时空数据库系统的复杂度。 展开更多
关键词 时空数据 设计 时态索引 时空数据库 时态检索 数据结构 R树 KD树
下载PDF
一种Rough集相对约简的计算方法 被引量:3
8
作者 裴小兵 王元珍 《计算机科学》 CSCD 北大核心 2006年第2期185-187,共3页
本文引入邻域分明合取项集概念,讨论了邻域分明合取项集的计算方法。在此基础上,利用约简集 RED_Q(U—{x_o},P)计算约简集 RED_Q(U,P)的思想,给出了相对约简的判定定理,从而提出了一种相对约简的计算方法。由于该方法不用计算分明矩阵... 本文引入邻域分明合取项集概念,讨论了邻域分明合取项集的计算方法。在此基础上,利用约简集 RED_Q(U—{x_o},P)计算约简集 RED_Q(U,P)的思想,给出了相对约简的判定定理,从而提出了一种相对约简的计算方法。由于该方法不用计算分明矩阵的中间环节,节省了空间和时间,提高了运行效率。实验结果表明,该约简算法在效率上较现有的约简算法有一定提高。 展开更多
关键词 ROUGH集 相对约简 分明矩阵
下载PDF
利用prefix-hash-tree实现从中文文本到事务数据的转换
9
作者 钱铁云 王元珍 冯小年 《计算机科学》 CSCD 北大核心 2005年第5期167-169,184,共4页
电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数... 电子文档的飞速增长为自动文本分类提供了巨大的机遇和挑战。在现有的众多方法中,关联分类以其较高的准确率和较快的训练时间而成为一种重要的自动文本分类方法。为实现基于关联的文本分类,首先需要将无结构的文本转换为结构化的事务数据,本文提出的prefix-hash-tree是针对汉语的特殊性而设计的一种数据结构,利用它可以方便地将中文文本转化为事务数据,实验证明利用该数据结构相应的查找、插入和重构算法都具有较好的效率。 展开更多
关键词 中文文本 HASH 事务 自动文本分类 电子文档 分类方法 文本转换 数据结构 实验证明 重构算法 准确率 结构化 特殊性 结构相 关联
下载PDF
基于颜色和形状特征的彩色图像表示与检索技术 被引量:15
10
作者 曹奎 冯玉才 曹忠升 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2001年第10期906-911,共6页
提出了一种有效用于抽取特征、索引和检索彩色图像的技术途径 .通过提取图像的颜色不变量 ,建立相应的色度直方图 (hue histogram )来表示图像的颜色分布特征 .为了描述图像中对象的位置及方向特征 ,首先计算图像的色度轮廓并对其进行 R... 提出了一种有效用于抽取特征、索引和检索彩色图像的技术途径 .通过提取图像的颜色不变量 ,建立相应的色度直方图 (hue histogram )来表示图像的颜色分布特征 .为了描述图像中对象的位置及方向特征 ,首先计算图像的色度轮廓并对其进行 Radon变换 ,然后计算相应的“空间直方图”.由此 ,得到了一种基于图像的颜色分布特征和形状特征的新的图像表示方法 .为了计算图像的全局相似度 ,基于“累积距离”和“基于向量的距离”定义了两种图像的距离度量 ,并分别讨论了距离度量的选取与归一化、不同子特征的组合等 CBIR所涉及的关键问题 .实验结果表明 ,文中提出的方法能获得满意的检索性能 。 展开更多
关键词 图像检索 颜色索引 形状索引 直方图 RADON变换 彩色图像表示 图像处理
下载PDF
一种基于颜色的图像表示及全局相似检索技术 被引量:8
11
作者 曹奎 冯玉才 王元珍 《计算机研究与发展》 EI CSCD 北大核心 2001年第9期1121-1126,共6页
基于内容的图像检索是当前图像数据库领域中的一个研究热点 .给出了一种描述图像视觉特征的图像表示方法 ,并据此计算图像之间的全局相似度 .首先 ,通过对彩色空间的分析 ,提取图像中的颜色不变量 ,然后在频域内对这样的颜色信息进行分... 基于内容的图像检索是当前图像数据库领域中的一个研究热点 .给出了一种描述图像视觉特征的图像表示方法 ,并据此计算图像之间的全局相似度 .首先 ,通过对彩色空间的分析 ,提取图像中的颜色不变量 ,然后在频域内对这样的颜色信息进行分析 .对频域分析的结果进行 K- L变换 ,变换后的低维向量即为图像的颜色表示 .在此基础上 ,也讨论了图像的相似度量以及相应的图像检索技术 ,并给出了实验结果和图像检索性能的评价 . 展开更多
关键词 图像数据库 图像表示 全局相似检索 图像处理 计算机
下载PDF
MRR:基于MBR的空间关系模型 被引量:6
12
作者 陈琳 杜友福 王元珍 《计算机工程与应用》 CSCD 北大核心 2002年第5期76-78,共3页
一些空间数据模型依赖于空间对象的近似表示,如广泛运用的最小边界矩形MBR,MBR的优点是关系存储和计算的有效性,但是MBR表示与它对应对象间的拓扑关系存在不一致性的矛盾。该文的MRR模型基于MBR,减少了MBR中不一致性。
关键词 地理信息系统 模糊空间系统 多矩形表示 MRR MBR 空间关系模型
下载PDF
反编译中的静态库识别研究 被引量:10
13
作者 许向阳 雷涛 朱虹 《计算机工程与应用》 CSCD 北大核心 2004年第9期37-39,共3页
库函数的识别是整个反编译过程的一个重要组成部分。根据可执行程序的静态库的识别过程,该文提出了在这个过程出现的中间代码生成、伪函数模块识别、库函数提取、库函数识别等问题,并给出了对这些问题的解决方法。这些方法在实际的静态... 库函数的识别是整个反编译过程的一个重要组成部分。根据可执行程序的静态库的识别过程,该文提出了在这个过程出现的中间代码生成、伪函数模块识别、库函数提取、库函数识别等问题,并给出了对这些问题的解决方法。这些方法在实际的静态库的识别中得到很好的应用。 展开更多
关键词 反编译 静态库 库函数 伪函数
下载PDF
图像检索中一种新的相关反馈机制 被引量:7
14
作者 曹奎 冯玉才 王元珍 《计算机科学》 CSCD 北大核心 2002年第1期65-68,共4页
1.引言近年来,随着图像数据的大量增加,对图像进行智能化、基于内容的处理愈来愈引起人们的极大兴趣.除了使用手工输入的关键字外(基于文本的方法),其于内容的图像检索(Content-Based Image Retrleval,CBIR)系统也使用图像的视觉特征来... 1.引言近年来,随着图像数据的大量增加,对图像进行智能化、基于内容的处理愈来愈引起人们的极大兴趣.除了使用手工输入的关键字外(基于文本的方法),其于内容的图像检索(Content-Based Image Retrleval,CBIR)系统也使用图像的视觉特征来建立图像索引,所使用的图像低层特征包括:颜色、纹理和形状等. 展开更多
关键词 图像检索 图像特征 反馈机制 图像处理 计算机
下载PDF
一种基于可扩展散列表的倒排索引更新策略 被引量:6
15
作者 吴恒山 刘兴宇 左琼 《计算机工程》 CAS CSCD 北大核心 2004年第8期83-84,F003,共3页
该文提出一种新的基于可扩展散列表的倒排索引更新策略,使倒排索引具有良好的可扩展性。它既支持文档的插入、删除操作,又具有较高的查询效率和空间利用率。并在它的基础上,实现了倒排索引的增量更新和实时更新。
关键词 全文检索 倒排索引 增量更新 可扩展散列表
下载PDF
彩色图象的联合分布表示及检索技术 被引量:4
16
作者 曹奎 冯玉才 +1 位作者 曹忠升 张军 《中国图象图形学报(A辑)》 CSCD 北大核心 2001年第11期1084-1088,共5页
随着图象数据的大量涌现 ,基于内容的图象检索技术已成为图象数据库领域的研究热点 .在图象检索系统中 ,由于颜色直方图方法简单方便 ,所以它已成为 CBIR系统中最常用的一种技术方法 ,然而 ,经典的颜色直方图方法存在诸多缺陷 ,例如它... 随着图象数据的大量涌现 ,基于内容的图象检索技术已成为图象数据库领域的研究热点 .在图象检索系统中 ,由于颜色直方图方法简单方便 ,所以它已成为 CBIR系统中最常用的一种技术方法 ,然而 ,经典的颜色直方图方法存在诸多缺陷 ,例如它不能表示图象中颜色的空间分布信息 .为此 ,人们提出了直方图细化技术 ,即将图象的颜色分布表示扩充成为颜色和其他相关特征的联合分布 .为了进一步提高图象检索能力 ,在分析图象特征的基础上 ,给出了两种加权直方图模型 :其一是将图象的颜色分布和细节信号能量的分布集成到单个直方图之中 ;另一种模型是将图象颜色及其边界强度的联合分布集成到一个直方图中 .这两种方法不仅保持了经典直方图简单方便的特点 ,同时又有效地将空间信息集成到直方图中 .实验结果表明 。 展开更多
关键词 图象表示 颜色直方图 颜色分布 加权直方图 彩色图象分析 图象检索 空间约束 联合直方图
下载PDF
基于Skowron分明矩阵的快速约简算法 被引量:7
17
作者 王元珍 裴小兵 《计算机科学》 CSCD 北大核心 2005年第4期42-44,共3页
属性约简是Rough集理论的核心内容之一,计算所有的属性约简已经被证明是NP完全问题。本文基于分而自治思想,在Skowron分明矩阵法的基础上,给出了最小析取范式的判定定理,从而提出了计算所有属性约简的算法。理论分析和实验结果表明,该... 属性约简是Rough集理论的核心内容之一,计算所有的属性约简已经被证明是NP完全问题。本文基于分而自治思想,在Skowron分明矩阵法的基础上,给出了最小析取范式的判定定理,从而提出了计算所有属性约简的算法。理论分析和实验结果表明,该约简算法在效率上较现有的算法有显著提高。 展开更多
关键词 约简算法 分明矩阵 ROUGH集理论 属性约简 NP完全问题 核心内容 判定定理 析取范式 矩阵法 计算 最小
下载PDF
结合类频率的关联中文文本分类 被引量:12
18
作者 钱铁云 王元珍 冯小年 《中文信息学报》 CSCD 北大核心 2004年第6期30-36,共7页
该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关... 该文提出一种词类频率和关联中文文本分类相结合的算法ARCTC。此算法将文档视作事务 ,关键词视作项 ,并针对文本事务的特性 ,提出利用词的类频率筛选与分类相关性不大的词汇 ,然后将改进的关联规则挖掘算法用于挖掘项和类别间的相关关系。挖掘出的规则用于形成类别特征词的集合 ,可用来和类标号未知文档的词的集合求交集 ,交集元素个数最多者即为所分类别。实验证明 ,该算法在提高训练时间和测试时间的同时具有较好的召回率、准确率和F Measure。 展开更多
关键词 计算机应用 中文信息处理 基于关联的分类 中文文本分类 词类频率 类别特征词集合
下载PDF
基于关联规则挖掘的中文文本自动分类 被引量:13
19
作者 王元珍 钱铁云 冯小年 《小型微型计算机系统》 CSCD 北大核心 2005年第8期1380-1383,共4页
随着电子出版物和互联网文档的飞速增加,自动文档分类工作正变得日渐重要.提出一种基于关联规则的中文文本自动分类方法.该算法将文档视作事务,关键词视作项,利用改进的关联规则挖掘算法挖掘项和类别间的相关关系.挖掘出的规则形成分类... 随着电子出版物和互联网文档的飞速增加,自动文档分类工作正变得日渐重要.提出一种基于关联规则的中文文本自动分类方法.该算法将文档视作事务,关键词视作项,利用改进的关联规则挖掘算法挖掘项和类别间的相关关系.挖掘出的规则形成分类器,可用于类标号未知的文档的区分.实验证明,该算法能较快地获得可理解的规则并且具有较好的召回率和准确率. 展开更多
关键词 基于关联的分类 中文文本分类 关联规则挖掘
下载PDF
超越支持度-置信度框架的负相关对规则挖掘 被引量:6
20
作者 钱铁云 冯小年 王元珍 《计算机科学》 CSCD 北大核心 2005年第10期124-127,163,共5页
相关规则比传统的关联规则更具有实际意义。但现存的相关规则挖掘算法均需利用apriori类似算法挖掘具有高支持度的项集,再对获得的项集进行相关性测试而获取相关规则,这导致低支持度-高相关度的规则不易被发现。直接挖掘相关规则的困难... 相关规则比传统的关联规则更具有实际意义。但现存的相关规则挖掘算法均需利用apriori类似算法挖掘具有高支持度的项集,再对获得的项集进行相关性测试而获取相关规则,这导致低支持度-高相关度的规则不易被发现。直接挖掘相关规则的困难在于候选相关项不能利用apriori类似性质进行剪枝,导致搜索空间爆炸性增长。本文提出的算法MNI利用Phi相关系数的下界来产生候选负相关项,从而缩小负相关项搜索空间,并证明了该算法的完全性和正确性。在负相关项对基础上利用规则可靠度产生负相关规则时,提出将负相关对计数统一转化为正相关对计数的方法。在真实数据集上的实验结果表明,该算法MNI能有效提高负相关项对的挖掘速度。 展开更多
关键词 关联规则 相关规则 Phi相关系数 规则可靠度 规则挖掘 负相关 APRIORI 置信度 挖掘算法 相关规则 框架 搜索空间 实际意义
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部