期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于SSL-DDPM的脑电疲劳状态检测方法
1
作者 张麟华 郭彩萍 +2 位作者 许骁哲 富丽贞 邢珍珍 《现代电子技术》 北大核心 2024年第21期40-45,共6页
疲劳检测对日常生活是至关重要的,尤其对于驾驶领域。基于脑电(EEG)信号的疲劳驾驶检测已吸引了众多学者的关注,但由于高质量带标签的EEG样本稀少问题严重阻碍了疲劳检测领域的发展。因此,文中首次将自监督学习(SSL)与扩散模型(DDPM)相... 疲劳检测对日常生活是至关重要的,尤其对于驾驶领域。基于脑电(EEG)信号的疲劳驾驶检测已吸引了众多学者的关注,但由于高质量带标签的EEG样本稀少问题严重阻碍了疲劳检测领域的发展。因此,文中首次将自监督学习(SSL)与扩散模型(DDPM)相结合应用于EEG的疲劳检测研究中,提出一种基于SSL-DDPM的脑电疲劳状态检测方法。该方法分为预训练和下游任务两部分,预训练阶段中首先对原始信号进行DDPM扩增,然后以ResNeXt代替ResNet为骨干网络对扩增前后的EEG信号进行特征提取,最后对提取的特征进行信号重构。下游任务的网络以共享预训练网络参数为主,对扩增前后的信号进行疲劳检测。通过SEED数据集和Multi-channel数据集进行实验验证,最终分类准确率分别达到88.23%和86.14%,验证了文中疲劳状态检测方法的有效性。 展开更多
关键词 脑电信号 疲劳检测 自监督学习 扩散模型 骨干网络 信号重构
下载PDF
大规模图数据可达性索引技术:现状与展望 被引量:16
2
作者 富丽贞 孟小峰 《计算机研究与发展》 EI CSCD 北大核心 2015年第1期116-129,共14页
随着社交网络、生物信息网、本体等新兴领域的飞速发展,在现实应用中涌现出大量的图数据.可达性查询是有向图上一类最基本的查询.当图的规模非常小时,利用深度优先遍历(depth-first search,DFS)或可达性传递闭包可以很容易处理可达性查... 随着社交网络、生物信息网、本体等新兴领域的飞速发展,在现实应用中涌现出大量的图数据.可达性查询是有向图上一类最基本的查询.当图的规模非常小时,利用深度优先遍历(depth-first search,DFS)或可达性传递闭包可以很容易处理可达性查询.但是,随着图的规模越变越大,由于DFS方法的查询效率太低而可达性传递闭包方法占用的存储空间太大,这2种方法不再适用.因此,许多可达性索引方法相继被提出.这些方法已经被广泛应用于多个计算机科学领域,如软件工程、编程语言、分布式计算、社交网络分析、生物网络分析、XML和RDF数据库、路由规划等领域.此外,可达性索引还可用于加速其他图算法,如最短路径查询和子图模式匹配.首先介绍了可达性索引的应用背景.接着,依据支持的数据规模、数据类型以及查询类别,将现有可达性索引工作进行了分类,并对代表性工作进行分类比较;最后,讨论了现有的大规模图数据可达性索引方法存在的问题,并指出了未来的研究方向. 展开更多
关键词 可达性 索引 查询处理 编码 图数据
下载PDF
一种新的XML数据编码方案 被引量:1
3
作者 富丽贞 陶世群 《电脑开发与应用》 2007年第10期47-48,53,共3页
如何对XML文档进行高效的查询,特别是包含查询处理,越来越受到研究界的关注。一种好的XML文档树编码方案可以很好地支持在XML文档上进行包含查询。为了加快XML数据的处理,利用完全二叉树的特性,提出了一种新的编码方案BTC。与区间编码... 如何对XML文档进行高效的查询,特别是包含查询处理,越来越受到研究界的关注。一种好的XML文档树编码方案可以很好地支持在XML文档上进行包含查询。为了加快XML数据的处理,利用完全二叉树的特性,提出了一种新的编码方案BTC。与区间编码和前缀编码相比,该编码具有简单和长度短的优点,实践证明该编码是有效的。 展开更多
关键词 完全二叉树 编码 包含查询
下载PDF
有向图上的广义可达性查询处理方法
4
作者 富丽贞 孟小峰 《计算机科学与探索》 CSCD 2012年第7期577-585,共9页
随着社会网络、生物信息学、本体等应用的迅速发展,如何在图上进行高效的信息检索成为一个亟待解决的问题。两点间可达性查询是一种常见的查询方式,目前针对此类查询已经提出了许多算法。但是在一些应用中,这种查询语义并不能满足用户... 随着社会网络、生物信息学、本体等应用的迅速发展,如何在图上进行高效的信息检索成为一个亟待解决的问题。两点间可达性查询是一种常见的查询方式,目前针对此类查询已经提出了许多算法。但是在一些应用中,这种查询语义并不能满足用户需求。基于此,提出了两种广义可达性查询语义。研究了如何在大图上进行高效的广义可达性查询的问题,依据Path-tree编码的特性提出了一种新的二级索引机制——RB+索引。基于RB+索引,针对不同类型查询提出了两种高效的查询处理方法。该方法充分利用Path-tree编码的特性,有效地处理广义可达性查询。通过实验对提出的索引和查询算法进行了验证。 展开更多
关键词 广义可达性查询 Path—tree编码 RB+索引
下载PDF
基于多类支持向量机的恒星光谱分类方法 被引量:8
5
作者 张静 刘忠宝 +2 位作者 宋文爱 富丽贞 章永来 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2018年第7期2307-2310,共4页
支持向量机作为一种经典的分类方法被广泛应用于恒星光谱分类领域。该方法在实际应用中取得了较为理想的分类效果,但其面临无法解决多分类问题的挑战。在支持向量机的基础上,提出多类支持向量机,建立基于多类支持向量机的恒星光谱分类... 支持向量机作为一种经典的分类方法被广泛应用于恒星光谱分类领域。该方法在实际应用中取得了较为理想的分类效果,但其面临无法解决多分类问题的挑战。在支持向量机的基础上,提出多类支持向量机,建立基于多类支持向量机的恒星光谱分类模型。该方法的最大优势是经过一次分类过程,可以确定多类样本的类属。SDSS DR8恒星光谱数据上的比较实验表明,本研究所提的方法较之已有多分类方法在分类性能上有一定的提升。 展开更多
关键词 支持向量机 多类支持向量机 恒星光谱 自动分类
下载PDF
一种高效非归并的XML小枝模式匹配算法 被引量:9
6
作者 陶世群 富丽贞 《软件学报》 EI CSCD 北大核心 2009年第4期795-803,共9页
在XML数据库中,小枝模式查询是XML查询处理的核心操作.近几年,研究人员已提出许多种算法,如Holistic Twig和TJFast算法等.然而它们都是基于归并的,会有很高的计算代价.已提出的Twig2Stack和TwigList算法虽然可以克服这一点,但算法非常复... 在XML数据库中,小枝模式查询是XML查询处理的核心操作.近几年,研究人员已提出许多种算法,如Holistic Twig和TJFast算法等.然而它们都是基于归并的,会有很高的计算代价.已提出的Twig2Stack和TwigList算法虽然可以克服这一点,但算法非常复杂.针对这一问题,尤其是考虑了通常查询表达式中只有少数几个结点是最终的输出结点这一特点,提出了TiwgNM算法及其扩展算法TiwgNME算法.算法不需要归并,且只用了少数栈来实现.实验结果表明,这些算法优于以前算法,尤其是对查询中只有祖先-后裔关系的表达式更有效. 展开更多
关键词 小枝模式匹配 归并 主路径 主结点 谓词结点
下载PDF
基于信息熵的医疗概念语义相似度算法 被引量:2
7
作者 王超 宋文爱 +1 位作者 富丽贞 张晶亮 《计算机工程与设计》 北大核心 2017年第6期1491-1495,共5页
针对医疗概念中传统语义相似度计算精确度不高的问题,提出一种基于信息熵计算概念特征相似度和概念相关度的方法,综合得出概念语义相似度的计算模型。利用朴素贝叶斯分类对医疗概念分类,根据概念分类概率与分类质量评估函数得到概念的... 针对医疗概念中传统语义相似度计算精确度不高的问题,提出一种基于信息熵计算概念特征相似度和概念相关度的方法,综合得出概念语义相似度的计算模型。利用朴素贝叶斯分类对医疗概念分类,根据概念分类概率与分类质量评估函数得到概念的信息熵;通过熵值求得概念特征相似度,通过分析概念特征信息求得概念相关度;利用加权的方法将前两者的值综合为最终的概念语义相似度。实验结果表明,该算法较传统算法更加接近医疗领域专家评估的经验值,可以提高相似度计算精度,为医疗领域的相关应用和研究提供更高效的方法。 展开更多
关键词 信息熵 朴素贝叶斯分类 概念相关度 概念特征相似度 概念语义相似度
下载PDF
基于熵学习机的恒星光谱分类(英文) 被引量:1
8
作者 刘忠宝 任娟娟 +3 位作者 宋文爱 张静 孔啸 富丽贞 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2018年第2期660-664,共5页
数据挖掘被广泛应用于恒星光谱分类。为了提高传统光谱分类方法性能,提出熵学习机(Entropybased Learning Machine,ELM)。在该方法中,熵用来刻画分类的不确定性。为了得到理想的分类结果,分类的不确定性应最小,基于此,可得ELM的最优化... 数据挖掘被广泛应用于恒星光谱分类。为了提高传统光谱分类方法性能,提出熵学习机(Entropybased Learning Machine,ELM)。在该方法中,熵用来刻画分类的不确定性。为了得到理想的分类结果,分类的不确定性应最小,基于此,可得ELM的最优化问题。ELM在处理二分类问题和稀有光谱发现等方面具有一定优势。SDSS中K型、F型、G型恒星光谱数据集上的比较实验表明:ELM在进行恒星光谱分类时,其分类性能优于k近邻(k Nearest Neighbor)和支持向量机(Support Vector Machine)等传统分类方法。 展开更多
关键词 数据挖掘 恒星光谱分类 斯隆数字巡天
下载PDF
电子病历的检索和结果多样化算法研究 被引量:2
9
作者 王超 宋文爱 +1 位作者 富丽贞 张晶亮 《科学技术与工程》 北大核心 2016年第36期190-195,200,共7页
为使用户在电子病历中的检索更贴近用户意图,提出用图结构来表示电子病历数据的研究方法。根据电子病历所具有的实体和属性联系与图的拓扑结构类似的特性,首先将电子病历数据和检索图结构化;将EMRSearch算法与EMR-Tree索引结合,并引入新... 为使用户在电子病历中的检索更贴近用户意图,提出用图结构来表示电子病历数据的研究方法。根据电子病历所具有的实体和属性联系与图的拓扑结构类似的特性,首先将电子病历数据和检索图结构化;将EMRSearch算法与EMR-Tree索引结合,并引入新的Upper bound模型进行裁剪;然后进行匹配,最后将匹配得到的结果集通过Sort Diversity算法进行多样性重排序。实验结果表明,该方法不仅可以提高用户检索效率,还可以提高用户搜索满意度。 展开更多
关键词 电子病历 图结构 图的搜索 多样性排序
下载PDF
基于路网感知的时空轨迹聚类 被引量:5
10
作者 翟婷 宋文爱 +1 位作者 富丽贞 史磊 《计算机工程与设计》 北大核心 2016年第3期635-642,共8页
通过研究传统的轨迹聚类算法,针对现有算法中存在的不足,提出一种基于路网感知的时空轨迹聚类算法(NEASTT)。依据真实路网信息划分轨迹,在保证时空强连续、高流量的情况下,有选择地合并相邻时空聚类单元,得到移动对象在某聚集时间片内... 通过研究传统的轨迹聚类算法,针对现有算法中存在的不足,提出一种基于路网感知的时空轨迹聚类算法(NEASTT)。依据真实路网信息划分轨迹,在保证时空强连续、高流量的情况下,有选择地合并相邻时空聚类单元,得到移动对象在某聚集时间片内的高流量、强连续运动路径,可为交通规划及基于位置的服务等应用提供更有利的帮助。实验结果表明,该聚类方法能有效挖掘时空轨迹聚类,揭示在一定时间片段内移动对象运动的代表路径。 展开更多
关键词 移动对象轨迹 聚类算法 路网 时空轨迹聚类 基于位置的服务
下载PDF
基于深度学习的短文本语义相似度计算模型 被引量:9
11
作者 周圣凯 富丽贞 宋文爱 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第3期49-56,共8页
基于深度学习的短文本语义相似度度量方法是现代自然语言处理任务的基石,其重要性不言而喻。本文提出一种基于卷积神经网络和双向门控循环单元的文本编码模型,通过卷积层提取重要语义并且通过双向门控循环单元保证语义顺序,采用孪生神... 基于深度学习的短文本语义相似度度量方法是现代自然语言处理任务的基石,其重要性不言而喻。本文提出一种基于卷积神经网络和双向门控循环单元的文本编码模型,通过卷积层提取重要语义并且通过双向门控循环单元保证语义顺序,采用孪生神经网络结构保证文本编码的一致性。选取传统的卷积神经网络和长短期记忆网络以及BERT模型进行对比验证,在Quora、Sick和MSRP数据集上的验证结果表明,本文模型的精确率和召回率表现优异,且F_(1)值也优于传统模型。 展开更多
关键词 自然语言处理 语义相似度 卷积神经网络 长短期记忆网络 门控循环单元
下载PDF
面向大规模图数据的分布式子图匹配算法 被引量:6
12
作者 许文 宋文爱 +1 位作者 富丽贞 吕伟 《计算机科学》 CSCD 北大核心 2019年第4期28-35,共8页
图数据规模的爆发式增长使在单机上的子图匹配变得较为困难。尽管现有的分布式算法可以在一定程度上解决大规模图数据的子图匹配问题,但分布式环境中的网络通信代价仍然影响着算法的性能。为此,文中提出了DSsearch分布式子图匹配算法,... 图数据规模的爆发式增长使在单机上的子图匹配变得较为困难。尽管现有的分布式算法可以在一定程度上解决大规模图数据的子图匹配问题,但分布式环境中的网络通信代价仍然影响着算法的性能。为此,文中提出了DSsearch分布式子图匹配算法,包含查询图拆分、数据图预处理、候选顶点过滤、中间结果合并4个步骤。其中,在数据图预处理步骤中使用图划分和完善邻居顶点策略来降低匹配过程中分布式计算节点之间的通信代价;在过滤候选顶点阶段设计DSgraph存储结构存储候选顶点,通过推迟笛卡尔积来减少冗余的中间结果。最后设计了对比实验并在具有7个计算节点的Spark分布式集群上使用真实数据集进行验证。实验结果表明,DSsearch算法能够在秒级时间内完成对百万规模顶点的数据图的子图匹配,尤其是在处理复杂查询图和稠密数据图方面更高效。数据图预处理策略的实验结果说明了通过顶点复制来降低分布式环境中网络通信代价这一策略的可行性。相比TwinTwigJoin、PSgL等算法,随着查询图顶点数量的增加,DSsearch算法的运行时间增长得更缓慢,当查询图顶点数量达到14时,其运行时间是TwinTwigJoin和PSgL算法的一半。实验数据充分说明,分布式环境中的网络通信代价和中间结果数量是影响分布式子图匹配算法的主要因素。实现数据图的预处理和推迟笛卡尔积解决了分布式子图匹配的性能瓶颈问题,有效地完成了大规模图数据的子图匹配。 展开更多
关键词 子图匹配 子图查询 分布式 图数据 图划分
下载PDF
基于LDA耦合空间模型的作文跑题检测方法研究 被引量:2
13
作者 孟超颖 宋文爱 富丽贞 《计算机应用研究》 CSCD 北大核心 2019年第12期3544-3547,共4页
传统的跑题检测方法大部分是将文本转换为向量空间的向量表示,再计算与正确文章之间的相似度来得到是否跑题的结果,然而这种方法仅针对文章语句结构上的表示,却忽略了文章语义上的关联,并且对于题目发散度较高的作文跑题检测效果较低。... 传统的跑题检测方法大部分是将文本转换为向量空间的向量表示,再计算与正确文章之间的相似度来得到是否跑题的结果,然而这种方法仅针对文章语句结构上的表示,却忽略了文章语义上的关联,并且对于题目发散度较高的作文跑题检测效果较低。针对以上问题,利用题目与正文主题词在耦合空间计算其相关度,再通过聚类的方法实现无监督的作文跑题检测。实验结果表明,基于耦合空间模型的作文跑题检测方法不论对于题目发散度较低还是较高的作文的检测准确度都有一定程度的提高,其中对于题目发散度较高的作文更为明显。 展开更多
关键词 作文跑题检测 耦合空间 主题词提取 相关度
下载PDF
双输入流深度反卷积的插值神经网络
14
作者 张强 杨剑 富丽贞 《计算机应用》 CSCD 北大核心 2019年第8期2271-2275,共5页
在实际工作中深度学习方法通常不具备大量的训练样本,因此提出了双输入流深度反卷积生成神经网络的构架,依据给定的条件产生新的目标图像,从而扩充训练样本集。该神经网络的整体架构由双输入的卷积网络和一个反卷积网络输出构成,其中双... 在实际工作中深度学习方法通常不具备大量的训练样本,因此提出了双输入流深度反卷积生成神经网络的构架,依据给定的条件产生新的目标图像,从而扩充训练样本集。该神经网络的整体架构由双输入的卷积网络和一个反卷积网络输出构成,其中双输入卷积网络接收目标物体不同视角的两张图片并提取抽象特征,而反卷积网络则利用抽象特征和设定的参数产生新的插值目标图像。在ShapeNetCore数据集上的实验结果显示,在相同数量的训练样本空间中,与未扩展数据集的卷积网络相比,双输入流深度反卷积生成神经网络的识别率提高了20%左右。结果表明,双输入流深度反卷积生成神经网络无需输入目标物类别,可生成新参数条件下的目标图像,扩充训练样本空间,从而提高识别率,可用于少样本的目标物多角度识别。 展开更多
关键词 深度学习 人工智能 生成神经网络 反卷积 双输入流
下载PDF
大规模图数据边受限制的最短距离查询算法
15
作者 吕伟 宋文爱 +1 位作者 富丽贞 许文 《计算机工程与应用》 CSCD 北大核心 2019年第7期71-81,86,共12页
计算两点之间的最短距离是标记图的基本操作之一。对于大图,根据路标节点估算两点之间最短距离的方法来提高查询效率。现有的路标节点选择策略不能在中心性和计算量小两方面同时满足,路标节点存储到其他节点的距离信息,存储量仍然很大... 计算两点之间的最短距离是标记图的基本操作之一。对于大图,根据路标节点估算两点之间最短距离的方法来提高查询效率。现有的路标节点选择策略不能在中心性和计算量小两方面同时满足,路标节点存储到其他节点的距离信息,存储量仍然很大。对于大规模有向图来说,路标节点选取策略保证中心性的同时减少了计算量,使用了DBSCAN聚类思想将节点划分成不同的类,选择具有联通性的向前和向后核心节点作为向前和向后路标节点;存储类内路标节点与普通节点之间的距离信息以及类间路标节点之间的距离信息来减少存储量;源节点通过向后路标节点和向前路标节点到达目标节点,采用上界和下界的最小均值作为估计值。理论证明算法策略在时间复杂度和空间复杂度方面与传统方法相比降低了。实验证明对于大图在平均相对误差方面与传统方法误差数量级相同。 展开更多
关键词 图数据 边受限制 预处理 最短距离查询
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部