期刊文献+
共找到98篇文章
< 1 2 5 >
每页显示 20 50 100
基于扩展Trie树的中文敏感词变体检测
1
作者 赵天舒 沈颖 +2 位作者 李柏岩 刘晓强 朱旻 《智能计算机与应用》 2024年第4期215-221,共7页
网络语言表达方式的随意性和自由性使词语变体在网页上经常出现,给网页信息安全带来了挑战。本文针对中文敏感词变体检测问题,提出一种基于扩展Trie树的敏感词变体快速检测方法。首先,对中文敏感词变体类型进行归类,结合中文敏感词特点... 网络语言表达方式的随意性和自由性使词语变体在网页上经常出现,给网页信息安全带来了挑战。本文针对中文敏感词变体检测问题,提出一种基于扩展Trie树的敏感词变体快速检测方法。首先,对中文敏感词变体类型进行归类,结合中文敏感词特点,通过增强节点内信息和节点间联系构建扩展Trie树;再依据中文变体的生成规则检索Trie树;最后,使用基于BERT的二分类算法对结果进行二次判别,降低误检率。实验表明:该算法精准度达到98.69%,召回率达到94.25%,能够识别常见的中文敏感词变体并在时间效率上满足应用需求。 展开更多
关键词 敏感词 词语变体 trie BERT
下载PDF
基于哈希和双数组trie树的多层次地址匹配算法 被引量:11
2
作者 徐聪 张丰 +3 位作者 杜震洪 张逸然 陈明 刘仁义 《浙江大学学报(理学版)》 CAS CSCD 2014年第2期217-222,共6页
针对目前地址匹配算法匹配速率低、空间开销大的不足,提出了一种基于哈希和双数组trie树的多层次地址匹配算法.利用中文地址的分类、分层及组合规则,改进了地址匹配词典的构建方式,减少了词典构建的时间和空间开销.通过哈希运算,将空间... 针对目前地址匹配算法匹配速率低、空间开销大的不足,提出了一种基于哈希和双数组trie树的多层次地址匹配算法.利用中文地址的分类、分层及组合规则,改进了地址匹配词典的构建方式,减少了词典构建的时间和空间开销.通过哈希运算,将空间坐标存储在哈希表相应的位置上,加快了空间坐标的检索效率.同时,在地址匹配的过程中,采用双向扫描及哈希运算代替传统的数据库检索方式,提高了地址匹配速率.最后,通过实验对算法的有效性进行了验证. 展开更多
关键词 哈希函数 双数组trie 地址分类 地址规则 地址匹配
下载PDF
基于多槽哈夫曼Trie树的规则引擎快速匹配算法 被引量:3
3
作者 罗谦 唐常杰 +1 位作者 于磊 郑皎凌 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2011年第5期102-108,共7页
为了提高机场类企业数据在海量规则集合中的匹配能力,提出了基于多槽哈夫曼Trie树(MSTHTrie)的规则引擎快速匹配算法。该算法充分利用了规则点属性名数与规则条数之间的不对称特性,将对规则的线性比对转换为对多槽的并行比对,从而在稳... 为了提高机场类企业数据在海量规则集合中的匹配能力,提出了基于多槽哈夫曼Trie树(MSTHTrie)的规则引擎快速匹配算法。该算法充分利用了规则点属性名数与规则条数之间的不对称特性,将对规则的线性比对转换为对多槽的并行比对,从而在稳定的空间复杂度下提高了规则引擎的匹配效率。首先对通用规则进行了严格的形式化描述,并在合理假设条件下证明了槽内规则分布命题和动作数定理;然后基于动作数定理提出了简化操作符的MSH tree算法;随之扩展操作类型提出了MSHTrie算法,使规则引擎有了普适性;最后在国内枢纽机场的业务数据上完成对比实验,表明新算法在空间复杂度上较传统线性匹配算法节约了52.6%,匹配性能上与Policytree算法相比提高了21.3%。 展开更多
关键词 规则引擎 匹配 多槽 哈夫曼树 trie
下载PDF
Trie树路由查找算法在网络处理器中的实现 被引量:11
4
作者 张琦 金胤丞 +1 位作者 李苗 章建雄 《计算机工程》 CAS CSCD 2014年第1期98-102,共5页
Trie树数据结构的实现方法灵活,所需存储器空间小,是实现高速路由查找和分组转发的理想选择。为满足10 Gb/s线速度网络处理器中微引擎的设计要求,提出一种基于最优平衡、多层存储的Trie树路由查找算法。建立一种平衡的压缩树结构,将该... Trie树数据结构的实现方法灵活,所需存储器空间小,是实现高速路由查找和分组转发的理想选择。为满足10 Gb/s线速度网络处理器中微引擎的设计要求,提出一种基于最优平衡、多层存储的Trie树路由查找算法。建立一种平衡的压缩树结构,将该树中相邻的多层节点压缩到一个存储节点中。通过构造特定的数据存储结构来减小树的搜索深度,以空间换取时间,从而提高路由查找速度和分组转发效率。在网络处理器的查找微引擎设计中实现Trie路由查找算法,实验结果表明,单个微引擎的查找速度为4.4 Mb/s,能达到节省存储空间、提高查找效率的效果。 展开更多
关键词 网络处理器 路由查找 最长前缀匹配 路径压缩 trie 算法实现
下载PDF
基于Trie树的相似字符串查找算法 被引量:10
5
作者 刘丽霞 张志强 《计算机应用》 CSCD 北大核心 2013年第8期2375-2378,共4页
基于Trie树的相似字符串查找算法是利用编辑距离的阈值来计算每个节点的活跃节点集,已有算法由于存在大量的冗余计算,导致时间复杂度和空间复杂度都比较高。针对这个问题,采用了基于活跃节点的对称性和动态规划算法的思想对已有算法进... 基于Trie树的相似字符串查找算法是利用编辑距离的阈值来计算每个节点的活跃节点集,已有算法由于存在大量的冗余计算,导致时间复杂度和空间复杂度都比较高。针对这个问题,采用了基于活跃节点的对称性和动态规划算法的思想对已有算法进行改进,并对活跃节点集进行了修剪,提出了New-Trie-Stack算法。该算法避免了活跃节点的重复计算,以及已有算法在保存所有已遍历节点的活跃节点集时的空间开销。实验结果表明New-Trie-Stack算法在时间复杂度和空间复杂度上都有明显的下降。 展开更多
关键词 trie 相似字符串 编辑距离 活跃节点 动态规划
下载PDF
一种基于哈希表和Trie树的快速IP路由查找算法 被引量:7
6
作者 崔尚森 张白一 《计算机工程与应用》 CSCD 北大核心 2005年第9期156-158,共3页
Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。论文提出了一种基于8比特的前向查找表(LFT)和7比特的简单二进制回退查找Trie树(HBT)的IP路由查找算法。... Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。论文提出了一种基于8比特的前向查找表(LFT)和7比特的简单二进制回退查找Trie树(HBT)的IP路由查找算法。算法综合考虑了IP地址的分布特点,兼顾了查找速度、存储空间利用、硬件实现,以及向IPv6过渡等几个因素。具有算法简单、查找速度较快、存储空间利用率较高、易于扩展和便于硬件实现等特点。 展开更多
关键词 路由查找 最长前缀匹配 哈希 trie
下载PDF
基于双数组Trie树的中文分词词典算法优化研究 被引量:8
7
作者 杨文川 刘健 于淼 《计算机工程与科学》 CSCD 北大核心 2013年第9期127-131,共5页
基于双数组Trie树的中文分词词典具有较高的查找效率,但其插入时间复杂度较高。为此提出了一种基于双数组Trie树结构的改进算法iDAT,在原始词典初始化时优先处理分支多的节点,并在初始化之后对base数组中的空序列的下标值做Hash,Hash表... 基于双数组Trie树的中文分词词典具有较高的查找效率,但其插入时间复杂度较高。为此提出了一种基于双数组Trie树结构的改进算法iDAT,在原始词典初始化时优先处理分支多的节点,并在初始化之后对base数组中的空序列的下标值做Hash,Hash表中存放空序列之前的所有空序列个数之和,而后运用iDAT算法进行插入。本算法借鉴了单模式匹配的Sunday算法中的跳跃思想,在适当增加空间开销的基础上,降低了Trie树在动态插入过程中的平均时间复杂度,在实际操作过程中有着良好的性能。 展开更多
关键词 双数组 trie 时间复杂度 分词词典
下载PDF
基于随机分布的多比特Trie树IP数据包分类算法研究 被引量:2
8
作者 尚凤军 潘英俊 +1 位作者 潘雪增 毕斌 《通信学报》 EI CSCD 北大核心 2008年第7期109-117,共9页
在无冲突散列算法和多比特Trie树算法的基础上,提出了一种基于随机分布的IP分类算法,该算法的核心有3点:一是基于目的/源端口和协议域构造无冲突散列,由于该三域的组合数目非常少,避免了空间爆炸;二是将目的/源IP连成比特串后分为4块,每... 在无冲突散列算法和多比特Trie树算法的基础上,提出了一种基于随机分布的IP分类算法,该算法的核心有3点:一是基于目的/源端口和协议域构造无冲突散列,由于该三域的组合数目非常少,避免了空间爆炸;二是将目的/源IP连成比特串后分为4块,每块16bit,并将其中一块映射到一随机空间,将随机数和其余3块进行异或,获得分类索引值,并用此值生成多比特Trie树,一般情况下减小了空间和时间复杂度;三是在Trie树终点存放最终分类规则的索引值,为了保证查找到的规则的正确性,对每一个索引值的源/目的IP地址均匹配一次。通过以上3点改进一般要降低算法的时间复杂度和空间复杂度,通过仿真,当对10000条分类规则进行包分类时,该算法的包分类速度可以达到2Mpacket/s,所消耗的最大内存为1MB。 展开更多
关键词 IP分类 查找算法 多比特trie 随机分布
下载PDF
基于Trie树的哈希表 被引量:3
9
作者 史长琼 唐铭 +1 位作者 张大方 周恺卿 《计算机应用》 CSCD 北大核心 2010年第8期2193-2196,共4页
受到AC算法与链式哈希的启发,提出了一种基于Trie树的哈希表。该算法通过增加一个后继状态计数器,能够为后续的查找等运算提供更加简单和快速的信息。分析与实验表明该算法具有较高的效率、较强的稳定性,且降低了能耗。
关键词 AC算法 trie 分离位的串匹配 链式哈希表 分段哈希表
下载PDF
最长前缀匹配查找的索引分离trie树结构及其算法 被引量:5
10
作者 崔尚森 冯博琴 《计算机工程与应用》 CSCD 北大核心 2005年第20期131-134,共4页
Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。索引分离trie树结构建立了具有k比特的一级索引,m比特的二级索引和步宽为s、最大深度为m/s的多分支trie树... Internet的飞速发展要求核心路由器每秒能转发几百万个以上的分组,实现高速分组转发的关键是路由表的组织和快速的路由查找算法。索引分离trie树结构建立了具有k比特的一级索引,m比特的二级索引和步宽为s、最大深度为m/s的多分支trie树结构。在这种数据结构中进行最长前缀匹配查找的算法复杂度为:O(m/s+2)。它具有算法简单、查找速度快、易于更新、便于向IPv6过渡等特点,是一种综合性能较好的快速最长前缀匹配查找算法。 展开更多
关键词 最长前缀匹配 索引表 trie 快速查找 快速更新
下载PDF
一种基于Trie树和扩展B树的RFID标签编码过滤方法研究 被引量:1
11
作者 赵文 刘学洋 +1 位作者 刘殿兴 王立福 《电子学报》 EI CAS CSCD 北大核心 2011年第A03期126-133,共8页
面向EPC模式(EPC Pattern)的标签编码过滤是RFID中间件的主要功能之一.为提高过滤效率,本文给出了一种基于trie树和扩展B树相结合的标签编码过滤方法.通过分析标签编码和EPC模式的结构特征,将系统中大量的EPC模式构造成一个层次查找结构... 面向EPC模式(EPC Pattern)的标签编码过滤是RFID中间件的主要功能之一.为提高过滤效率,本文给出了一种基于trie树和扩展B树相结合的标签编码过滤方法.通过分析标签编码和EPC模式的结构特征,将系统中大量的EPC模式构造成一个层次查找结构,对于EPC模式中的常规编码段采用trie树表达,对于区间形式采用扩展B树表达.查找过程按照编码段由高至低依次进行,并采用了基于位向量集合的优化方法.实验表明标签编码过滤效率受EPC模式数量变化的影响较小,能够有效降低向上层应用传输数据的延迟. 展开更多
关键词 RFID 中间件 EPC模式 过滤 trie B树
下载PDF
基于Trie树的词语左右熵和互信息新词发现算法 被引量:12
12
作者 郭理 张恒旭 +1 位作者 王嘉岐 秦怀斌 《现代电子技术》 北大核心 2020年第6期65-69,共5页
由于大量新词的出现,使得中文文本分析产生了较大的困难,因此新词发现成为目前中文自然语言处理中的热点和难点问题。为此,文中提出了一种基于Trie树的词语左右熵和互信息新词发现算法。先根据成词规则,筛选掉文本中的停用词和非中文字... 由于大量新词的出现,使得中文文本分析产生了较大的困难,因此新词发现成为目前中文自然语言处理中的热点和难点问题。为此,文中提出了一种基于Trie树的词语左右熵和互信息新词发现算法。先根据成词规则,筛选掉文本中的停用词和非中文字符,将每个字与其右邻的字组成二元组;然后利用左右信息熵和互信息进行成词概率的计算,根据计算到的成词概率和词频筛选出新词;并且设计了三个实验,验证了算法的有效性和可行性。实验结果表明,该新词发现算法成词准确率较高,比其他新词发现算法时间效率有较大的提高,对于中文分词结果的优化起到重要的作用。 展开更多
关键词 新词发现算法 左右熵 互信息 trie 算法设计 对比验证
下载PDF
支持快速索引的高效大数据存储结构 被引量:1
13
作者 肖英 赵林洁 +1 位作者 张宇 屈晓芳 《计算机应用与软件》 北大核心 2024年第3期28-33,共6页
Trie树为处理字符串数据提供了高效的存储和索引。然而,当字符串数据很大时,利用Trie树进行数据存储会导致空间效率变得很低。因此,提出一种支持快速索引的高效大数据存储结构,称为16-bit Trie树,该结构使用16位表示子节点信息,同时用... Trie树为处理字符串数据提供了高效的存储和索引。然而,当字符串数据很大时,利用Trie树进行数据存储会导致空间效率变得很低。因此,提出一种支持快速索引的高效大数据存储结构,称为16-bit Trie树,该结构使用16位表示子节点信息,同时用映射表帮助快速索引至指定的子节点,使得16-bit Trie树在处理大数据时仍然具有高效的空间效率。结果表明,16-bit Trie树保留了传统Trie树较高的索引速度,同时提高了其空间效率。与红黑树和B+树相比,16-bit Trie树的插入时间和空间消耗基本相同,但在索引速度上比其快了2倍左右。 展开更多
关键词 字符串检索 trie树结构 字符串处理及索引 快速检索
下载PDF
网络安全态势感知中Trie树关键词高速匹配算法研究 被引量:9
14
作者 徐国天 张铭 《信息网络安全》 CSCD 北大核心 2019年第4期55-62,共8页
海量数据中关键词高速检索对增强网络安全态势感知系统反应速度,提高系统整体效率和安全性具有重要意义。基于双数组Trie树的网络信息检索算法具有较高的查找效率,但其插入时间复杂度较高,同时叶子结点占用了大量存储空间。为此,文章提... 海量数据中关键词高速检索对增强网络安全态势感知系统反应速度,提高系统整体效率和安全性具有重要意义。基于双数组Trie树的网络信息检索算法具有较高的查找效率,但其插入时间复杂度较高,同时叶子结点占用了大量存储空间。为此,文章提出一种基于叶子结点压缩存储的双数组Trie树构造方法,按层次遍历Trie树,将分枝结点存储在基本双数组中,对叶子结点进行压缩后以位图形式存储于压缩数组中。该方法在保留双数组Trie树查询性能的同时,一定程度上提高了插入效率,改善了存储空间利用效率。 展开更多
关键词 态势感知 双数组 trie 压缩 信息检索
下载PDF
一种基于哈希表和Trie树的快速内容路由查找算法 被引量:1
15
作者 汪志莉 沈富可 《计算机应用与软件》 CSCD 2009年第10期247-249,255,共4页
内容分发网络CDN(Content Delivery Network)是一个建立并覆盖在互联网之上的一层特殊网络,专门用于通过互联网高效传递丰富的多媒体内容。与传统的网络一样,要求核心路由器每秒能转发几百万个以上的分组,而实现高速分组转发的关键是路... 内容分发网络CDN(Content Delivery Network)是一个建立并覆盖在互联网之上的一层特殊网络,专门用于通过互联网高效传递丰富的多媒体内容。与传统的网络一样,要求核心路由器每秒能转发几百万个以上的分组,而实现高速分组转发的关键是路由表的组织和快速的路由查找算法。首先概述了内容路由网络的背景,罗列出了几种常见的路由查找算法,并在此基础上,引入基于Hash和Trie树的路由查找算法,最后在试验的基础上对平均查找时间、平均查找次数以及最大匹配次数进行了比较分析,试验结论显示该算法缩短了查找时间,提高了系统性能。 展开更多
关键词 CDN(内容分发网络) 最长后缀匹配 哈希 trie
下载PDF
基于双数组Trie树法的关键字预处理技术及其在CNC语法检验中的应用 被引量:2
16
作者 王子牛 曹凌菲 王岩 《贵州大学学报(自然科学版)》 2010年第1期49-52,61,共5页
语法检验在CNC系统中占有相当大的比重,尤其是在数控系统的自动或MDI方式下运行。NC代码的正确与否直接关系到能否正确完成数控加工,而现在国内自主开发CNC系统的语法检验功能还不够完善,并且检验方法也不尽科学。针对五轴联动高档数控... 语法检验在CNC系统中占有相当大的比重,尤其是在数控系统的自动或MDI方式下运行。NC代码的正确与否直接关系到能否正确完成数控加工,而现在国内自主开发CNC系统的语法检验功能还不够完善,并且检验方法也不尽科学。针对五轴联动高档数控机床,参照双数组Trie算法的原理,提出了基于双数组Trie算法的关键字预处理技术,并将其成功地应用在语法检验之中,从而使得对NC代码的语法检测更加准确。 展开更多
关键词 双数组trie树算法 关键字预处理 语法检验 CNC
下载PDF
基于Trie树和有限状态自动机的中文地址解析模型 被引量:3
17
作者 汪洋 刘师培 王峥 《计算机与现代化》 2016年第7期60-67,共8页
目前,无论是在研究或者是商业领域中,中文地址解析都没有一个成熟的模型结果。要素识别是地址解析的关键技术,传统的地址要素识别是基于特征词和字典匹配的方法,难以解决地址命名的多样性问题。利用自然语言处理技术,根据Trie树模型对... 目前,无论是在研究或者是商业领域中,中文地址解析都没有一个成熟的模型结果。要素识别是地址解析的关键技术,传统的地址要素识别是基于特征词和字典匹配的方法,难以解决地址命名的多样性问题。利用自然语言处理技术,根据Trie树模型对行政区域寻址的方法和有限状态自动机模型对非规范地址的要素提取方法,本文提出T-FA模型对地址进行分级划分。其中,采用隐马尔可夫模型的切词方法和最长公共子序列算法,可以解决地址要素识别的模糊化搜索。T-FA模型具有良好的泛化能力,在批量处理地址时具有很好的通用效果,能比较有效地解决中文地址多样化的解析难题。 展开更多
关键词 自然语言处理 地址解析 要素识别 trie树模型 有限状态自动机模型
下载PDF
基于Trie树的快速电子词典开发 被引量:1
18
作者 蔡琪 刘东霞 《现代电子技术》 2014年第12期90-92,共3页
当今社会在步入一个大数据时代,时间和效率举足轻重。因此设计和开发出一款能快速检索目标词汇的电子词典具有十分重要的现实意义。开发的电子词典系统运用Windows API开发,采用Trie树的数据结构设计。结果表明:电子词典实现了Trie树结... 当今社会在步入一个大数据时代,时间和效率举足轻重。因此设计和开发出一款能快速检索目标词汇的电子词典具有十分重要的现实意义。开发的电子词典系统运用Windows API开发,采用Trie树的数据结构设计。结果表明:电子词典实现了Trie树结构的存取和快速Hash映射查词,实现主流电子词典常用功能,包括单词查找、添加生词、我的单词本、课程设置、单词测试和帮助等,可满足大部分用户的需求,具有良好的扩展性。 展开更多
关键词 快速检索 trie Hash查找 电子词典
下载PDF
一种基于trie的频繁项集发现算法 被引量:2
19
作者 郑丽英 《兰州铁道学院学报》 2003年第6期27-29,共3页
挖掘频繁项集是关联规则算法中的关键步骤.分析了hash树作为数据结构实现寻找频繁项集的方法,讨论了数据结构trie及其特性,并提出用trie作数据结构实现频繁项集的快速发现.其特点是:不依赖用户定义的支持度阀值;只需扫描一遍数据库;可... 挖掘频繁项集是关联规则算法中的关键步骤.分析了hash树作为数据结构实现寻找频繁项集的方法,讨论了数据结构trie及其特性,并提出用trie作数据结构实现频繁项集的快速发现.其特点是:不依赖用户定义的支持度阀值;只需扫描一遍数据库;可以快速计算项集的支持度;支持动态数据库. 展开更多
关键词 trie 频繁项集 发现算法 关联规则算法 数据结构 数据库 HASH树 数据挖掘
下载PDF
基于压缩Trie树的以太网地址查找结构
20
作者 陈虎 张平健 奚建清 《计算机工程》 CAS CSCD 北大核心 2007年第4期17-19,共3页
介绍了一种基于hash表和压缩trie树的查找与更新方法,每个hash桶中的4个地址节点按照trie树的方式组织,并压缩成一个25位字。基于FPGA实现时查找速度为133MSPS,IXP1200的一个微引擎每秒可完成1M次转发表更新。与采用片上嵌入式存储器的... 介绍了一种基于hash表和压缩trie树的查找与更新方法,每个hash桶中的4个地址节点按照trie树的方式组织,并压缩成一个25位字。基于FPGA实现时查找速度为133MSPS,IXP1200的一个微引擎每秒可完成1M次转发表更新。与采用片上嵌入式存储器的以太网交换芯片相比,查找过程可以减少一半的存储器访问带宽,转发表可放置到大容量片外存储器中,从而减少交换芯片面积和成本,显著降低hash表的冲突率。 展开更多
关键词 trie 以太网地址查找 HASH表
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部