期刊文献+
共找到96篇文章
< 1 2 5 >
每页显示 20 50 100
基于决策树算法的Word格式文件数据抽取方法
1
作者 庄自会 《中国新技术新产品》 2024年第14期49-51,共3页
由于Word格式文件数据抽取方法直接对数据自动抽取模型进行构建,没有对数据容量进行自适应处理,因此数据抽取效果较差。本文提出基于决策树算法的Word格式文件数据抽取方法,可对数据容量进行自适应处理,提升数据抽取的效率和准确性。并... 由于Word格式文件数据抽取方法直接对数据自动抽取模型进行构建,没有对数据容量进行自适应处理,因此数据抽取效果较差。本文提出基于决策树算法的Word格式文件数据抽取方法,可对数据容量进行自适应处理,提升数据抽取的效率和准确性。并基于决策树算法构建数据自动抽取模型,输出文件数据抽取策略,进行Word格式文件数据抽取。试验结果表明,该方法提高了抽取效率,降低了系统资源的占用率,从而降低了数据抽取开销。 展开更多
关键词 决策树算法 Word格式文件 数据抽取方法 自动化处理
下载PDF
基于Web网页的DOM树链接预分类、信息抽取方法研究
2
作者 罗莎 《长江信息通信》 2023年第11期133-135,共3页
为满足Web网页的数据记录、自动抽取需求,提出依托DOM树特征的网页信息链接预分类、领域本体的Web信息抽取方法,根据HTML、XML网页文档结构设置DOM对象节点树,标记网页页码导航节点、前导符节点、数据特征节点,用DOM根节点到目标节点的... 为满足Web网页的数据记录、自动抽取需求,提出依托DOM树特征的网页信息链接预分类、领域本体的Web信息抽取方法,根据HTML、XML网页文档结构设置DOM对象节点树,标记网页页码导航节点、前导符节点、数据特征节点,用DOM根节点到目标节点的标签序列计算树路径,根据各网页链接的XPATH树路径进行分组,DOM树特征预分类模块完成站点信息链接预分类,采用SVM分类器、支持向量机SVM算法,将网页的数据记录样本作出数据信息抽取、属性特征提取计算,从而抽取出满足用户需求的数据文本、数据记录信息。 展开更多
关键词 WEB网页 DOM树特征 信息链接预分类 信息抽取方法
下载PDF
两种转换波共转换点道集抽取方法的对比分析与应用 被引量:2
3
作者 杨维 王小卫 边冬辉 《岩性油气藏》 CSCD 2013年第6期95-97,111,共4页
转换波在传播过程中的路径是不对称的,常规的共中心点道集抽取方法并不能满足共转换点叠加的需求,因此,针对转换波研究共转换点(CCP)道集的抽取方法十分必要。目前应用的共转换点道集抽取方法主要有渐近线方法和目的层方法。在对这2种... 转换波在传播过程中的路径是不对称的,常规的共中心点道集抽取方法并不能满足共转换点叠加的需求,因此,针对转换波研究共转换点(CCP)道集的抽取方法十分必要。目前应用的共转换点道集抽取方法主要有渐近线方法和目的层方法。在对这2种方法进行对比分析的基础上,针对某工区转换波地震数据,进行了共转换点道集的抽取,并对所得到的叠加剖面进行了对比分析。结果表明:目的层共转换点道集抽取方法优于渐近线方法,该方法能够灵活针对任一深度的目的层位计算转换点位置,在转换波数据处理过程中能够发挥重要的作用。 展开更多
关键词 转换波 共转换点道集 渐近线抽取方法 目的层抽取方法
下载PDF
低酚棉品种资源聚类分析及核心品种抽取方法的探讨 被引量:13
4
作者 张桂寅 王省芬 +1 位作者 刘素娟 马峙英 《棉花学报》 CSCD 北大核心 2004年第1期8-12,共5页
对我国低酚棉品种资源进行了聚类分析并探讨了核心品种的抽取方法。以116份低酚棉品种为材料,通过16个性状的分析,采用离差平方和法进行聚类,根据树状图,将该低酚棉群体分为5个类群,对各类群品种性状进行了分析。根据取样比例,将该群体... 对我国低酚棉品种资源进行了聚类分析并探讨了核心品种的抽取方法。以116份低酚棉品种为材料,通过16个性状的分析,采用离差平方和法进行聚类,根据树状图,将该低酚棉群体分为5个类群,对各类群品种性状进行了分析。根据取样比例,将该群体分为20个类群,在各类群内,采用随机抽样、按样品间最小遗传距离和最大遗传距离抽样三种方法,构建了3个低酚棉核心种质库,并加以比较。结果显示最大遗传距离法构建的核心种质库,能最大限度地保存原群体的遗传多样性。 展开更多
关键词 低酚棉 品种资源 聚类分析 抽取方法 核心种质库
下载PDF
基于框架的词语搭配自动抽取方法 被引量:18
5
作者 曲维光 陈小荷 吉根林 《计算机工程》 CAS CSCD 北大核心 2004年第23期22-24,195,共4页
提出了一种基于框架的词语搭配抽取方法,可以同时获取词语搭配以及搭配结构信息。引入相对词序比(RRWR)的方法对候选搭配词语进行筛选,应用语言学中词语搭配组合规律对候选搭配的词性进行限定,利用互信息等统计学模型在大规模语料中进... 提出了一种基于框架的词语搭配抽取方法,可以同时获取词语搭配以及搭配结构信息。引入相对词序比(RRWR)的方法对候选搭配词语进行筛选,应用语言学中词语搭配组合规律对候选搭配的词性进行限定,利用互信息等统计学模型在大规模语料中进行词语搭配的自动抽取,抽取的搭配平均准确率为84.73%,较Xtract系统高4.7%,较国内同类工作结果高50.79%。并且在获得搭配的同时得到了词语搭配的结构信息。 展开更多
关键词 自动抽取 结构信息 大规模 统计学模型 互信息 抽取方法 框架 词语搭配 同类 获取
下载PDF
术语自动抽取方法研究综述 被引量:19
6
作者 袁劲松 张小明 李舟军 《计算机科学》 CSCD 北大核心 2015年第8期7-12,共6页
术语抽取是文本处理领域的一项基础性研究工作,好的术语自动抽取方法能够提高本体构建的质量和语义检索的精度。首先,对术语的定义、特性以及术语抽取效果的评价方法进行了概述。然后,在分析和总结近20年术语自动抽取相关文献的基础上,... 术语抽取是文本处理领域的一项基础性研究工作,好的术语自动抽取方法能够提高本体构建的质量和语义检索的精度。首先,对术语的定义、特性以及术语抽取效果的评价方法进行了概述。然后,在分析和总结近20年术语自动抽取相关文献的基础上,对术语自动抽取的各种方法进行了详细的综述。介绍了这些方法的研究进展,分析了其优缺点,并详细描述了部分经典算法。最后,对术语自动抽取未来研究的趋势进行了展望。 展开更多
关键词 术语抽取 文本处理 评价方法 自动抽取方法
下载PDF
兔颞下颌关节腔穿刺定位及滑液抽取方法的研究 被引量:4
7
作者 王栋 田卫东 +2 位作者 李逸松 李声伟 刘磊 《华西口腔医学杂志》 CAS CSCD 北大核心 2003年第1期64-66,共3页
目的 对比各种对兔颞下颌关节腔的穿刺定位以及关节滑液提取的方法。方法  12只新西兰白兔双侧颞下颌关节分别按传统穿刺、改良穿刺、X线引导下穿刺、彩色超声诊断仪引导下穿刺、螺旋CT引导下穿刺以及运用微泵进行滑液的抽取进行对比... 目的 对比各种对兔颞下颌关节腔的穿刺定位以及关节滑液提取的方法。方法  12只新西兰白兔双侧颞下颌关节分别按传统穿刺、改良穿刺、X线引导下穿刺、彩色超声诊断仪引导下穿刺、螺旋CT引导下穿刺以及运用微泵进行滑液的抽取进行对比实验。结果 传统穿刺法仅 1个关节腔成功注射 ,且未抽到滑液 ;改良穿刺法 4个关节腔均成功注射但未抽到滑液 ;X线及彩色超声均定位不准确且不能抽到滑液 ;螺旋CT可直观动态观察且定位准确但也未抽到滑液 ;微泵可以抽取滑液。结论 运用改良穿刺法及螺旋CT可以准确的行兔颞下颌关节腔穿刺 。 展开更多
关键词 颞下颌关节腔 穿刺定位 滑液 抽取方法 研究
下载PDF
一种基于正交投影的特征抽取方法 被引量:4
8
作者 涂庆华 杨健 杨静宇 《小型微型计算机系统》 CSCD 北大核心 2003年第3期555-557,共3页
本文结合 Fisher鉴别准则给出了一组正交投影矢量 ,并引入了一种度量投影矢量相关性的简捷方法 .与经典的 Foley- Sam mon鉴别分析法相比 ,所提出的正交投影法具有较强的消除样本特征之间相关性的能力和良好的鉴别能力 .最后 ,在 CENPA... 本文结合 Fisher鉴别准则给出了一组正交投影矢量 ,并引入了一种度量投影矢量相关性的简捷方法 .与经典的 Foley- Sam mon鉴别分析法相比 ,所提出的正交投影法具有较强的消除样本特征之间相关性的能力和良好的鉴别能力 .最后 ,在 CENPARMI手写体阿拉伯数字库的试验结果证实了该特征抽取方法明显优于 Foley- Samm 展开更多
关键词 正交投影 特征抽取方法 FISHER鉴别准则 手写体数字识别
下载PDF
基于词汇链的中文短信主题语句抽取方法 被引量:3
9
作者 刘金岭 冯万利 张永军 《计算机工程与应用》 CSCD 2012年第7期132-134,共3页
提出一种基于词汇链的中文短信文本主题的抽取方法。该方法首先通过构造多条词汇链来表达短信文本的叙事线索,并从多条词汇链中抽取出富含主题信息的词汇链,将其作为构造短信文本主题语句的关键词序列。实验表明该方法抽取的短信文本主... 提出一种基于词汇链的中文短信文本主题的抽取方法。该方法首先通过构造多条词汇链来表达短信文本的叙事线索,并从多条词汇链中抽取出富含主题信息的词汇链,将其作为构造短信文本主题语句的关键词序列。实验表明该方法抽取的短信文本主题能够更全面地覆盖短信文本的信息,并能消除多个关键词序列表达同一主题信息的冗余。其效果明显优于采用统计信息进行短信文本主题抽取的方法。 展开更多
关键词 短信文本 词汇链 主题语句 抽取方法
下载PDF
一种新的基于细化的汉字笔画抽取方法及其在汉字识别中的应用 被引量:3
10
作者 张世辉 孔令富 《计算机工程与应用》 CSCD 北大核心 2002年第16期46-48,共3页
文章提出了一种新的基于细化的汉字笔画抽取方法,并把笔画统计特征用于汉字的识别。实验结果表明,该方法可有效地抽取出汉字的笔画并可成功地用于汉字的识别。
关键词 细化 汉字笔画抽取方法 汉字识别 特征库 模式识别 汉字信息处理
下载PDF
一种描述逻辑与DL-safe规则复合逻辑中的规则抽取方法 被引量:1
11
作者 张阔 李涓子 +1 位作者 唐杰 王克宏 《计算机科学》 CSCD 北大核心 2005年第8期121-123,共3页
OWL本体描述语言包含相对丰富的概念定义符,但提供的关系定义符描述能力则较差。将 OWL与规则相结合是克服这种表达能力限制的一种常用方法。Motik提出了一种可判定的方法,将SHIQ(D)描述逻辑与规则结合,所结合的规则限定在一种叫做DL-s... OWL本体描述语言包含相对丰富的概念定义符,但提供的关系定义符描述能力则较差。将 OWL与规则相结合是克服这种表达能力限制的一种常用方法。Motik提出了一种可判定的方法,将SHIQ(D)描述逻辑与规则结合,所结合的规则限定在一种叫做DL-safe规则的范围内。本文提出了一种抽取DL-safe规则的方法,方法利用SHIQ(D)逻辑中的UNION定义符满足一些规则在前件中包含析取逻辑运算符的需求,从而扩展了规则的描述能力。 展开更多
关键词 描述逻辑 DL-safe规则 OWL 语义网 抽取方法 safe 复合 概念定义 能力限制 逻辑运算符
下载PDF
基于词义的关键词抽取方法研究 被引量:5
12
作者 李有梅 《情报理论与实践》 CSSCI 北大核心 2000年第2期81-83,共3页
In the field of automatic information processing,how to precisely describe the text’s content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approxima... In the field of automatic information processing,how to precisely describe the text’s content has become a rather critical problem.The vector space presentation,which is widely applied at present,is used to approximately illustrate conceptions and meanings by extracting keywords from the text. 展开更多
关键词 文献标引 关键词 抽取方法 词义标注 词义聚类
下载PDF
亚麻种质资源聚类分析及核心品种抽取方法 被引量:8
13
作者 路颖 《中国麻业》 2005年第2期66-69,共4页
对亚麻种质资源进行了聚类分析并探讨了核心品种的抽取方法。以134份亚麻品种为材料,通过14个性状的分析,采用离差平方和法进行聚类,根据树状图,将该亚麻群体分为7个类群,对各类群品种性状进行了分析。根据取样比例,将该群体分为23个组... 对亚麻种质资源进行了聚类分析并探讨了核心品种的抽取方法。以134份亚麻品种为材料,通过14个性状的分析,采用离差平方和法进行聚类,根据树状图,将该亚麻群体分为7个类群,对各类群品种性状进行了分析。根据取样比例,将该群体分为23个组,在各组内,采用随机抽样、按样品间最小遗传距离和最大遗传距离抽样三种方法,构建了3个亚麻核心种质库,并加以比较。结果显示最大遗传距离法构建的核心种质库,能最大限度地保存原群体的遗传多样性。 展开更多
关键词 抽取方法 聚类分析 种质资源 亚麻 核心种质库 遗传距离 离差平方和 遗传多样性 品种性状 随机抽样 树状图 群体 距离法 类群 构建
下载PDF
网页数据智能抽取方法
14
作者 俞琰 《微处理机》 2006年第6期86-88,共3页
根据所要抽取网页的特点,提出了一种基于网页结构和ontology领域知识的自动网页数据抽取。并且使得ontology在数据抽取的过程中自动扩充。
关键词 网页数据抽取 ONTOLOGY 智能抽取方法 自动扩充
下载PDF
倾斜CCP道集抽取方法及影响因素分析 被引量:6
15
作者 于光明 姚陈 《煤田地质与勘探》 CAS CSCD 北大核心 2007年第4期65-69,共5页
界面上三维PS波(反射转换横波)的转换点在地表有相应的界面法向投影点,抽取CCP(共转换点)道集的实质就是确定不同方位上投影点距离炮点和对应检波点的比例关系。当界面倾斜时,该比例关系是界面的倾角、倾向、法向深度、炮检方位以及纵... 界面上三维PS波(反射转换横波)的转换点在地表有相应的界面法向投影点,抽取CCP(共转换点)道集的实质就是确定不同方位上投影点距离炮点和对应检波点的比例关系。当界面倾斜时,该比例关系是界面的倾角、倾向、法向深度、炮检方位以及纵横波速度比等参数的函数。就上述参数通过这一比例关系是如何影响共转换点道集的构成及影响程度设计了特定的模型进行讨论。计算结果表明,忽视倾斜界面的影响将引起转换波抽道集的混乱,并造成后期成像的错误。 展开更多
关键词 倾斜界面 共转换点 影响因素 抽取方法
下载PDF
基于字词混合和GRU的科技文本知识抽取方法 被引量:3
16
作者 欧阳苏宇 邵蓥侠 +1 位作者 杜军平 李昂 《广西科学》 CAS 北大核心 2022年第4期634-641,共8页
知识抽取任务是从非结构化的文本数据抽取三元组关系(头实体-关系-尾实体)。现有知识抽取方法分为流水式方法和联合抽取方法。流水式方法将命名实体识别和实体知识抽取分别用各自的模块抽取,这种方式虽然有较好的灵活性,但训练速度较慢... 知识抽取任务是从非结构化的文本数据抽取三元组关系(头实体-关系-尾实体)。现有知识抽取方法分为流水式方法和联合抽取方法。流水式方法将命名实体识别和实体知识抽取分别用各自的模块抽取,这种方式虽然有较好的灵活性,但训练速度较慢。联合抽取的学习模型是一种通过神经网络实现的端到端的模型,同时实现实体识别和知识抽取,能够很好地保留实体和关系之间的关联,将实体和关系的联合抽取转化为一个序列标注问题。基于此,本文提出了一种基于字词混合和门控制单元(Gated Recurrent Unit, GRU)的科技文本知识抽取(MBGAB)方法,结合注意力机制提取中文科技资源文本的关系;采用字词混合的向量映射方式,既在最大程度上避免边界切分出错,又有效融入语义信息;采用端到端的联合抽取模型,利用双向GRU网络,结合自注意力机制来有效捕获句子中的长距离语义信息,并且通过引入偏置权重来提高模型抽取效果。 展开更多
关键词 知识抽取 向量映射 GRU 三元组关系 联合抽取方法
下载PDF
基于代码克隆检测的抽取方法重构模式识别 被引量:1
17
作者 张志浩 杨春花 《计算机应用与软件》 北大核心 2019年第9期12-15,20,共5页
抽取方法是一种常用的代码重构手段,被广泛应用到软件开发和维护中。提出一个基于克隆检测的抽取方法重构模式的识别算法。以代码变更块hunk为单位,用代码克隆检测工具simian对候选的hunk进行筛选,用语法分析对该模式进行判定。在4个开... 抽取方法是一种常用的代码重构手段,被广泛应用到软件开发和维护中。提出一个基于克隆检测的抽取方法重构模式的识别算法。以代码变更块hunk为单位,用代码克隆检测工具simian对候选的hunk进行筛选,用语法分析对该模式进行判定。在4个开源项目上进行实验,结果表明该算法具有较高的准确率。 展开更多
关键词 重构模式 重构模式识别 代码克隆检测 代码变更 抽取方法
下载PDF
基于可复用构件抽取方法的研究与实现 被引量:2
18
作者 薛红梅 贾少锐 李燕 《福建电脑》 2005年第10期40-41,共2页
论述了基于UML的构件抽取方法:通过使用情形框图描述用户所关心的系统功能,用交互图来描述各种功能的具体实现流程以及涉及的相关类,通过分析使用情形及其交互图来确定系统的类,最后在完整的系统类图基础上抽象出系统的构件,得到系统的... 论述了基于UML的构件抽取方法:通过使用情形框图描述用户所关心的系统功能,用交互图来描述各种功能的具体实现流程以及涉及的相关类,通过分析使用情形及其交互图来确定系统的类,最后在完整的系统类图基础上抽象出系统的构件,得到系统的构件模型。 展开更多
关键词 构件 统一建模语言 图书馆管理系统 构件模型 可复用构件 抽取方法 系统功能 交互图 UML 框图
下载PDF
基于深度学习的非结构化表格文档数据抽取方法 被引量:2
19
作者 奚建飞 王志英 +1 位作者 邹文景 甘莹 《微型电脑应用》 2022年第2期102-105,共4页
非结构化表格文档结构性较低,模式多样且数据冗杂,但此类文档里潜藏大量有价值数据,数据高精度抽取对分析数据价值存在增值作用,为此提出基于深度学习的非结构化表格文档数据抽取方法。在数据抽取前,采用基于循环和卷积神经网络的文本... 非结构化表格文档结构性较低,模式多样且数据冗杂,但此类文档里潜藏大量有价值数据,数据高精度抽取对分析数据价值存在增值作用,为此提出基于深度学习的非结构化表格文档数据抽取方法。在数据抽取前,采用基于循环和卷积神经网络的文本分类方法,对非结构化表格文档实施分类,获取所需表格文档,由此缩小后续数据抽取范围,提高抽取效率与精度;在分类后的表格文档中使用基于深度学习的数据自动抽取模型,通过双向循环神经网络编码获取中间语义向量,然后通过注意力模型和单项循环神经网络解密中间语义向量,获取非结构化表格文档数据。实验结果表明,采用所提方法抽取10种非结构化表格文档数据时,均获取显著的抽取效果。 展开更多
关键词 深度学习 非结构化表格 文档数据 抽取方法 卷积神经网络
下载PDF
密封瓶药液抽取方法介绍 被引量:1
20
作者 杨雁 《护理研究(中旬版)》 2006年第12期3228-3228,共1页
关键词 药液浪费 抽取方法 密封瓶 针头斜面 抽吸药液 临床实践 护理人员 剂量不足
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部