期刊文献+
共找到363,563篇文章
< 1 2 250 >
每页显示 20 50 100
基于C2C网上陶瓷店铺平台的设计与实现:TP311 被引量:2
1
作者 陈正军 李辉星 刘莹 《电脑知识与技术》 2010年第5期3317-3318,共2页
课题从C2C(Customer to Customer)网上店铺着手,主要实现每个用户的网络经纪模式,保存交易记录,提供店主管理界面,允许用户评论商品,提供站内即时消息,并结合Ajax技术,提供较好的用户体验。平台基于C/S结构,利用ASP.NET平台、SQL serv... 课题从C2C(Customer to Customer)网上店铺着手,主要实现每个用户的网络经纪模式,保存交易记录,提供店主管理界面,允许用户评论商品,提供站内即时消息,并结合Ajax技术,提供较好的用户体验。平台基于C/S结构,利用ASP.NET平台、SQL serv-er2000数据库服务器以及VisualStudio.Net 2005开发工具,开发基于C2C的网上店铺平台。 展开更多
关键词 电子商务 C2C AJAX技术 .NET
下载PDF
Flex RIA技术在ERP系统中的应用TP311 被引量:1
2
作者 余小凡 杜友福 《电脑知识与技术》 2010年第5期3527-3528,共2页
对RIA技术进行讨论,采用Flex技术是希望提高与用户的交互性,在选择技术的过程中,看上Flex简单、好用及不用换页的互动效果,但是设计人员短期内不容易跳脱平面设计的思维,因此首先以功能性为主要考虑,暂时不要浪费人力在太多酷炫的机制上... 对RIA技术进行讨论,采用Flex技术是希望提高与用户的交互性,在选择技术的过程中,看上Flex简单、好用及不用换页的互动效果,但是设计人员短期内不容易跳脱平面设计的思维,因此首先以功能性为主要考虑,暂时不要浪费人力在太多酷炫的机制上。Flex版ERP功能上线后,使用者明显感受到差别,在Web的架构,没有安装与部署的麻烦,还可享有桌面应用程式的操作体验。而且使用者无需切换表单,就可动态导入各项资讯。该文最主要的就是体现了它在ERP系统中的报表的经典制作。 展开更多
关键词 RIA FLEX ERP系统 报表制作
下载PDF
微服务系统服务依赖发现技术综述 被引量:5
3
作者 张齐勋 吴一凡 +3 位作者 杨勇 贾统 李影 吴中海 《软件学报》 EI CSCD 北大核心 2024年第1期118-135,共18页
微服务架构得到了广泛的部署与应用,提升了软件系统开发的效率,降低了系统更新与维护的成本,提高了系统的可扩展性.但微服务变更频繁、异构融合等特点使得微服务故障频发、其故障传播快且影响大,同时微服务间复杂的调用依赖关系或逻辑... 微服务架构得到了广泛的部署与应用,提升了软件系统开发的效率,降低了系统更新与维护的成本,提高了系统的可扩展性.但微服务变更频繁、异构融合等特点使得微服务故障频发、其故障传播快且影响大,同时微服务间复杂的调用依赖关系或逻辑依赖关系又使得其故障难以被及时、准确地定位与诊断,对微服务架构系统的智能运维提出了挑战.服务依赖发现技术从系统运行时数据中识别并推断服务之间的调用依赖关系或逻辑依赖关系,构建服务依赖关系图,有助于在系统运行时及时、精准地发现与定位故障并诊断根因,也有利于如资源调度、变更管理等智能运维需求.首先就微服务系统中服务依赖发现问题进行分析,其次,从基于监控数据、系统日志数据、追踪数据等3类运行时数据的角度总结分析了服务依赖发现技术的技术现状;然后,以基于服务依赖关系图的故障根因定位、资源调度与变更管理等为例,讨论了服务依赖发现技术应用于智能运维的相关研究.最后,对服务依赖发现技术如何准确地发现调用依赖关系和逻辑依赖关系,如何利用服务依赖关系图进行变更治理进行了探讨并对未来的研究方向进行了展望. 展开更多
关键词 服务依赖 故障诊断 微服务
下载PDF
REST API自动化测试综述 被引量:1
4
作者 陈静 魏强 +1 位作者 武泽慧 王新蕾 《计算机应用研究》 CSCD 北大核心 2024年第2期321-328,340,共9页
REST API已经成为访问和使用云服务、Web、移动应用程序的重要途径,如何对这些API进行自动化测试以保证服务的安全性和可靠性是亟待解决的问题。目前虽然关于REST API自动化测试的研究成果众多,但仍缺少对测试技术全面的分析和总结。梳... REST API已经成为访问和使用云服务、Web、移动应用程序的重要途径,如何对这些API进行自动化测试以保证服务的安全性和可靠性是亟待解决的问题。目前虽然关于REST API自动化测试的研究成果众多,但仍缺少对测试技术全面的分析和总结。梳理了该领域近10年的代表性成果,首先总结了REST API自动化测试的发展历程;然后结合REST API自动化测试特征,提炼了测试的通用流程;接着分别从预处理、测试用例生成、测试用例执行与监测、结果分析四个环节阐述现有成果的技术特征,对比分析其优缺点;最后论述当前研究存在的不足,讨论可能的解决思路,展望了下一步研究方向。 展开更多
关键词 REST API 自动化测试 模糊测试 测试用例生成
下载PDF
面向云边端协同的多模态数据建模技术及其应用 被引量:1
5
作者 崔双双 吴限 +1 位作者 王宏志 吴昊 《软件学报》 EI CSCD 北大核心 2024年第3期1154-1172,共19页
云边端协同架构中数据类型多样,各级存储资源与计算资源存在差异,给数据管理带来新的挑战.现有数据模型或者数据模型的简单叠加,都难以同时满足云边端中多模态数据管理和协同管理需求.因此,研究面向云边端协同的多模态数据建模技术成为... 云边端协同架构中数据类型多样,各级存储资源与计算资源存在差异,给数据管理带来新的挑战.现有数据模型或者数据模型的简单叠加,都难以同时满足云边端中多模态数据管理和协同管理需求.因此,研究面向云边端协同的多模态数据建模技术成为重要问题.其核心在于,如何高效地从云边端三层架构中得到满足应用所需的查询结果.从云边端三层数据的数据类型出发,提出了面向云边端协同的多模态数据建模技术,给出了基于元组的多模态数据模型定义,设计了6种基类,解决多模态数据统一表征困难的问题;提出了云边端协同查询的基本数据操作体系,以满足云边端业务场景的查询需求;给出了多模态数据模型的完整性约束,为查询优化奠定了理论基础.最后,给出了面向云边端协同多模态数据模型的示范应用,并从数据存储时间、存储空间和查询时间这3个方面对所提出的数据模型存储方法进行了验证.实验结果表明,所提方案能够有效地表示云边端协同架构中的多模态数据. 展开更多
关键词 多模态数据模型 云边端协同 查询处理
下载PDF
基于大数据聚类的通信网络安全态势预测技术 被引量:5
6
作者 陈功平 王红 《淮阴师范学院学报(自然科学版)》 CAS 2024年第1期20-26,共7页
传统通信网络安全态势预测技术缺乏大数据支撑,难以对发生的攻击进行详细分类和追踪,导致在进行长时间的态势预测中收敛过慢,准确度降低.提出一种基于大数据聚类的通信网络安全态势预测技术.分析通信网络的属性以及特点,选择安全态势描... 传统通信网络安全态势预测技术缺乏大数据支撑,难以对发生的攻击进行详细分类和追踪,导致在进行长时间的态势预测中收敛过慢,准确度降低.提出一种基于大数据聚类的通信网络安全态势预测技术.分析通信网络的属性以及特点,选择安全态势描述一级指标,将数据标准化处理之后,细分出二级指标;优化大数据聚类算法,计算最优聚类数量、确定聚类中心,建立关联规则库并优化预测流程,完成基于大数据聚类的通信网络安全态势预测技术的设计.通过实验结果表明,与两种传统的安全态势预测技术相比,设计的技术收敛速度更快,全体数据点没有出现残差扩散的现象,并且数据完整度较高. 展开更多
关键词 大数据聚类 通信网络 安全态势 描述指标 聚类优化 收敛速度
下载PDF
基于样本嵌入的挖矿恶意软件检测方法 被引量:1
7
作者 傅建明 姜宇谦 +3 位作者 何佳 郑锐 苏日古嘎 彭国军 《计算机科学》 CSCD 北大核心 2024年第1期327-334,共8页
加密货币挖矿恶意软件的高盈利性和匿名性,对计算机用户造成了巨大威胁和损失。为了对抗挖矿恶意软件带来的威胁,基于软件静态特征的机器学习检测器通常选取单一类型的静态特征,或者通过集成学习来融合不同种类静态特征的检测结果,忽略... 加密货币挖矿恶意软件的高盈利性和匿名性,对计算机用户造成了巨大威胁和损失。为了对抗挖矿恶意软件带来的威胁,基于软件静态特征的机器学习检测器通常选取单一类型的静态特征,或者通过集成学习来融合不同种类静态特征的检测结果,忽略了不同种类静态特征之间的内在联系,其检测率有待提升。文章从挖矿恶意软件的内在层级联系出发,自下而上提取样本的基本块、控制流程图和函数调用图作为静态特征,训练三层模型以将这些特征分别嵌入向量化,并逐渐汇集从底层到高层的特征,最终输入分类器实现对挖矿恶意软件的检测。为了模拟真实环境中的检测情形,先在一个小的实验数据集上训练模型,再在另一个更大的数据集上测试模型的性能。实验结果表明,三层嵌入模型在挖矿恶意软件检测上的性能领先于近年提出的机器学习模型,在召回率和准确率上相比其他模型分别提高了7%和3%以上。 展开更多
关键词 挖矿恶意软件 静态分析 机器学习 图嵌入
下载PDF
基于证据理论的多传感器数据融合水质检测研究 被引量:1
8
作者 左现刚 张志霞 +3 位作者 王梦 刘艳昌 韩旭 丁佰成 《河南科技学院学报(自然科学版)》 2024年第2期56-64,共9页
针对多传感器水质监测数据融合中测量数据存在误差的现象,论文提出一种基于DS证据融合理论的多源监测数据融合算法.该算法将影响水质的氨氮含量(NH3-N)、溶解氧(DO)、pH值、电导率(CD)等多环境因子变量作为证据,并赋予可靠性折扣,计算... 针对多传感器水质监测数据融合中测量数据存在误差的现象,论文提出一种基于DS证据融合理论的多源监测数据融合算法.该算法将影响水质的氨氮含量(NH3-N)、溶解氧(DO)、pH值、电导率(CD)等多环境因子变量作为证据,并赋予可靠性折扣,计算出水质等级的质量函数,然后通过DS方法将其与其他证据结合起来,最后使用融合质量函数值的决策规则确定水质类别.实验证明这种方法适用于具有多源监测数据的水质类别预测,可以从不确定性传感器数据中评估水质,并提高评估性能. 展开更多
关键词 证据理论 传感器 数据融合 水质
下载PDF
城市内涝预警预报系统研发及应用 被引量:2
9
作者 高成 佘亮亮 +1 位作者 顾春旭 向小华 《中国水利》 2024年第3期34-38,共5页
城市内涝问题具有成因多元、影响面广的特点,是基础性社会问题。分析了城市内涝的成因,提出通过信息化手段提升城市内涝灾害应对能力。构建基于内涝实时物联感知、数据汇聚、数学模型预报、大数据分析、水利数字孪生的城市内涝预警预报... 城市内涝问题具有成因多元、影响面广的特点,是基础性社会问题。分析了城市内涝的成因,提出通过信息化手段提升城市内涝灾害应对能力。构建基于内涝实时物联感知、数据汇聚、数学模型预报、大数据分析、水利数字孪生的城市内涝预警预报系统,并在宁波市进行了应用。通过搭建“天基”监测预警、“落地雨”监测预警、内涝预报预警、内涝成因分析、内涝影响评估等功能模块,实现了城区内涝的精准模拟、风险图的在线绘制以及内涝损失的高效评估,有力支撑了城市暴雨内涝灾害预报预警,提升了城市内涝风险管控能力。 展开更多
关键词 城市内涝 智慧防御 预警预报系统 智慧水利
下载PDF
基于深度学习与机器视觉的起重机吊装安全监测方法 被引量:1
10
作者 薛志钢 许晨旭 +1 位作者 巫波 闻东东 《科技创新与应用》 2024年第2期1-5,共5页
随着我国经济的快速发展,各类大型工程层出不穷,对起重机吊装作业的需求不断增加。然而,吊装作业过程中依然存在众多的安全隐患,极易造成人员伤亡等安全事故。因此,该文提出一种基于深度学习和机器视觉的起重机吊装安全监测方法。将深... 随着我国经济的快速发展,各类大型工程层出不穷,对起重机吊装作业的需求不断增加。然而,吊装作业过程中依然存在众多的安全隐患,极易造成人员伤亡等安全事故。因此,该文提出一种基于深度学习和机器视觉的起重机吊装安全监测方法。将深度学习与机器视觉相结合对监控图像中的被吊物和工人进行识别和定位,同时可自主判断工人是否佩戴安全帽。根据监测模型的识别和定位信息,获得工人与被吊物之间的空间关系,为起重机吊装过程提供安全预警信息。为了提高所提方法的实用性和便携性,开发一个起重机吊装安全智能监测系统,不仅可以实时显示监控图像的识别结果,而且能够输出场景的语义描述、发出安全预警信号。 展开更多
关键词 深度学习 机器视觉 吊装监测 智能监测 安全预警
下载PDF
高职院校信息化建设方案与实现 被引量:1
11
作者 罗度军 段胜祥 +3 位作者 林敏 张涟漪 李博 魏甜 《武汉工程职业技术学院学报》 2024年第1期42-46,共5页
围绕建设一流职业大学的目标,建成高水平校园网基础设施公共平台,立足师生信息化应用的实际需求,高标准推进学校信息化建设。通过打造数字化校园、智慧校园,创设良好的信息化氛围,以信息技术对学校的各项工作进行数字化改造,构建数字化... 围绕建设一流职业大学的目标,建成高水平校园网基础设施公共平台,立足师生信息化应用的实际需求,高标准推进学校信息化建设。通过打造数字化校园、智慧校园,创设良好的信息化氛围,以信息技术对学校的各项工作进行数字化改造,构建数字化、集成化、智能化的信息环境,全面提升师生的信息素养和应用水平。高职院校的信息化建设前景还有较大的提升空间,最终建成优质安全、以人为本的智慧校园。 展开更多
关键词 高职院校 信息化建设 智慧校园
下载PDF
基于CAN通信实现MBD代码下载的DSP Bootloader开发 被引量:1
12
作者 郭毅锋 郭世成 +1 位作者 黄丽敏 张栗 《制造技术与机床》 北大核心 2024年第3期57-63,68,共8页
为了实现DSP嵌入式系统在实际应用中便捷下载MBD(model-based design)代码的需求,文章设计了一种基于CAN通信实现MBD代码下载的Bootloader方案。以TMS320F28335为例,通过对MBD代码的结构进行分析,设计了Boot程序与MBD程序的内存划分方案... 为了实现DSP嵌入式系统在实际应用中便捷下载MBD(model-based design)代码的需求,文章设计了一种基于CAN通信实现MBD代码下载的Bootloader方案。以TMS320F28335为例,通过对MBD代码的结构进行分析,设计了Boot程序与MBD程序的内存划分方案,确保程序下载的有效性和稳定性;开发了相应的Boot程序和上位机程序,详细介绍了Bootloader的实现流程,并对关键步骤函数进行了分析与解释,利用CAN通信实现了程序的下载。实验结果表明,该方法稳定可靠且具有实用性,为DSP嵌入式系统在实际应用中的MBD代码下载提供了一种可行且高效的解决方案。 展开更多
关键词 TMS320F28335 CAN通信 MBD代码下载 BOOTLOADER
下载PDF
基于区块链的可搜索加密技术研究综述 被引量:2
13
作者 孙国梓 王钰 +3 位作者 李兆维 韩瑞 万明发 袁腾 《南京邮电大学学报(自然科学版)》 北大核心 2024年第1期65-78,共14页
在数据外包服务中,为了保护用户隐私和数据安全,数据通常采用密文形式存储于云服务器中。对数据进行加密虽然一定程度上保护了用户数据,但是却带来了用户难以搜索密文中关键字的问题。可搜索加密概念的提出为解决这一问题提供了有效的途... 在数据外包服务中,为了保护用户隐私和数据安全,数据通常采用密文形式存储于云服务器中。对数据进行加密虽然一定程度上保护了用户数据,但是却带来了用户难以搜索密文中关键字的问题。可搜索加密概念的提出为解决这一问题提供了有效的途径,用户可以直接在加密数据上执行搜索和计算等复杂操作。然而由于不可靠的云服务器等问题,现有的可搜索加密技术仍然存在不支持公平支付、缺乏通用的验证机制和隐私泄露等问题。因此,文中介绍了可搜索加密和区块链两种技术,并讨论了基于区块链的可搜索加密与传统可搜索加密相比的优势;分析和比较了过去两年基于区块链的可搜索加密方案的特点、安全性和效率,并提出了当前方案中的缺陷和未来可能的工作方向。 展开更多
关键词 可搜索加密 云服务器 区块链 数据外包 数据安全 隐私泄露 验证机制 用户数据
下载PDF
基于Openstack云平台的校园二手物品交易系统的敏捷设计 被引量:1
14
作者 余久久 张继山 +2 位作者 吴宁 戴礼慧 刘丽 《通化师范学院学报》 2024年第2期76-81,共6页
通过Openstack云平台搭建服务器,利用J2EE的Struts-Spring-Hibernate(SSH)轻量级三层集成框架,采用软件敏捷方法 Scrum模型,快速设计并实现了基于Openstack云平台的校园二手物品交易系统.系统服务器端共享本地校园应用数据中心,在Openst... 通过Openstack云平台搭建服务器,利用J2EE的Struts-Spring-Hibernate(SSH)轻量级三层集成框架,采用软件敏捷方法 Scrum模型,快速设计并实现了基于Openstack云平台的校园二手物品交易系统.系统服务器端共享本地校园应用数据中心,在Openstack云平台上进行二手物品交易及管理方面的数据处理.客户端使用Android平台,为校园学生提供二手物品的查询、发布、交易、订单收藏、留言等功能.系统运行稳定,操作便捷,页面展示流畅. 展开更多
关键词 Openstack云平台 二手物品交易 Struts-Spring-Hibernate(SSH) 敏捷方法Scrum模型 用户故事 智慧校园
下载PDF
基于信誉分类的拜占庭容错共识算法 被引量:1
15
作者 高建彬 刘洋洋 +2 位作者 夏虎 程捷 夏琦 《无线电工程》 2024年第4期804-816,共13页
针对许可区块链场景下实用拜占庭容错(Practical Byzantine Fault Tolerance,PBFT)共识算法通信开销大、主节点选取随意以及吞吐量低等问题,通过引入并优化信誉评分模型(Reputation Scoring Model,RSM)。提出了一种基于信誉分类的拜占... 针对许可区块链场景下实用拜占庭容错(Practical Byzantine Fault Tolerance,PBFT)共识算法通信开销大、主节点选取随意以及吞吐量低等问题,通过引入并优化信誉评分模型(Reputation Scoring Model,RSM)。提出了一种基于信誉分类的拜占庭容错(Byzantine Fault Tolerance Based on Reputation Classification,RCBFT)共识算法。定义RSM,依据节点的历史共识行为所获得的信誉评分排序对参与节点进行动态分类以及分级管理,提出基于信誉分类的多层次节点架构;在可信节点层中随机选取节点来担任主节点,优化主节点选取机制;设计了缓冲节点层类型转换策略(Type Conversion Strategy for Nodes,TCSN),兼顾了环境等非主观因素导致低信誉评分的诚实节点不能参与共识的问题,使得诚实节点尽可能多地参与共识,而拜占庭节点快速下降到最差类型中限制共识权限;RCBFT共识算法还对传统三阶段共识协议进行优化,减少通信开销,在确保容错性的同时能够提高算法性能。实验分析表明,相较于PBFT共识算法,RCBFT共识算法能够提升交易吞吐量,降低通信开销与共识时延。 展开更多
关键词 区块链 共识算法 信誉分类 拜占庭节点 性能提升
下载PDF
融合自适应周期与兴趣量因子的轻量级GCN推荐 被引量:1
16
作者 钱忠胜 叶祖铼 +3 位作者 姚昌森 张丁 黄恒 秦朗悦 《软件学报》 EI CSCD 北大核心 2024年第6期2974-2998,共25页
推荐系统在成熟的数据挖掘技术推动下,已能高效地利用评分数据、行为轨迹等显隐性信息,再与复杂而先进的深度学习技术相结合,取得了很好的效果.同时,其应用需求也驱动着对基础数据的深度挖掘与利用,以及对技术要求的减负成为一个研究热... 推荐系统在成熟的数据挖掘技术推动下,已能高效地利用评分数据、行为轨迹等显隐性信息,再与复杂而先进的深度学习技术相结合,取得了很好的效果.同时,其应用需求也驱动着对基础数据的深度挖掘与利用,以及对技术要求的减负成为一个研究热点.基于此,提出一种利用GCN(graph convolutional network)方法进行深度信息融合的轻量级推荐模型LG_APIF.该模型结合行为记忆,通过艾宾浩斯遗忘曲线模拟用户兴趣变化过程,采用线性回归等相对轻量的传统方法挖掘项目的自适应周期等深度信息;分析用户当前的兴趣分布,计算项目的兴趣量,以获取用户的潜在兴趣类型;构建用户-类型-项目三元组的图结构,并结合减负后的GCN技术来生成最终的项目推荐列表.实验验证所提方法的有效性,通过与8个经典模型在Last.fm,Douban,Yelp,MovieLens数据集中的对比,表明该方法在Precision,Recall及NDCG指标上都得到良好改善,其中,Precision平均提升2.11%,Recall平均提升1.01%,NDCG平均提升1.48%. 展开更多
关键词 行为记忆 自适应周期 兴趣量因子 图卷积网络 推荐系统
下载PDF
面向高等教育教师的数据素养分析框架开发和评估:结构方程建模方法 被引量:1
17
作者 王东亮 韩冰 姚健 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期178-188,共11页
随着信息和通信技术的快速发展,教师数据素养已成为现代教育领域的一个重要趋势.该文基于高等教育教师数据素养的现状和需求,提出一种基于结构方程建模方法的教师数据素养分析框架,旨在探索一种可行的方法来提高教师数据素养水平.通过... 随着信息和通信技术的快速发展,教师数据素养已成为现代教育领域的一个重要趋势.该文基于高等教育教师数据素养的现状和需求,提出一种基于结构方程建模方法的教师数据素养分析框架,旨在探索一种可行的方法来提高教师数据素养水平.通过研究教师的技术整合自我效能感、技术知识水平、对技术的态度以及使用社交网络的目的与他们数据素养水平之间的关系,阐明和分析了数据素养水平与这些变量之间的关系.使用结构方程模型对来自415名教师的数据进行分析,查看变量之间的相关性,并确定哪些预测因素对教师数据素养能力影响最大.同时,通过对定量数据结果进行分析,验证和评估该文所提出的分析框架.采用关系筛选模型,在研究结果审查的模型中检测到教师的技术整合自我效能感是最重要的变量,对数据素养水平的预测具有重要影响.该文结果有助于指导并提升教师数据素养水平,达到提高教育教学质量和效果的目的. 展开更多
关键词 数据素养 分析框架 结构方程模型 影响因素 高等教育教师
原文传递
基于互信息和融合加权的并行深度森林算法 被引量:1
18
作者 毛伊敏 李文豪 《计算机应用研究》 CSCD 北大核心 2024年第2期473-481,共9页
针对大数据环境下并行深度森林算法中存在不相关及冗余特征过多、多粒度扫描不平衡、分类性能不足以及并行化效率低等问题,提出了基于互信息和融合加权的并行深度森林算法(parallel deep forest algorithm based on mutual information ... 针对大数据环境下并行深度森林算法中存在不相关及冗余特征过多、多粒度扫描不平衡、分类性能不足以及并行化效率低等问题,提出了基于互信息和融合加权的并行深度森林算法(parallel deep forest algorithm based on mutual information and mixed weighting,PDF-MIMW)。首先,在特征降维阶段提出了基于互信息的特征提取策略(feature extraction strategy based on mutual information,FE-MI),结合特征重要性、交互性和冗余性度量过滤原始特征,剔除过多的不相关和冗余特征;接着,在多粒度扫描阶段提出了基于填充的改进多粒度扫描策略(improved multi-granularity scanning strategy based on padding,IMGS-P),对精简后的特征进行填充并对窗口扫描后的子序列进行随机采样,保证多粒度扫描的平衡;其次,在级联森林构建阶段提出了并行子森林构建策略(sub-forest construction strategy based on mixed weighting,SFC-MW),结合Spark框架并行构建加权子森林,提升模型的分类性能;最后,在类向量合并阶段提出基于混合粒子群算法的负载均衡策略(load balancing strategy based on hybrid particle swarm optimization algorithm,LB-HPSO),优化Spark框架中任务节点的负载分配,降低类向量合并时的等待时长,提高模型的并行化效率。实验表明,PDF-MIMW算法的分类效果更佳,同时在大数据环境下的训练效率更高。 展开更多
关键词 Spark框架 并行深度森林 互信息 负载均衡
下载PDF
主题方面共享的领域主题层次模型
19
作者 万常选 张奕韬 +3 位作者 刘德喜 刘喜平 廖国琼 万齐智 《软件学报》 EI CSCD 北大核心 2024年第4期1790-1818,共29页
层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且... 层次主题模型是构建主题层次的重要工具.现有的层次主题模型大多通过在主题模型中引入nCRP构造方法,为文档主题提供树形结构的先验分布,但无法生成具有明确领域涵义的主题层次结构,即领域主题层次.同时,领域主题不仅存在层次关系,而且不同父主题下的子主题之间还存在子领域方面共享的关联关系,在现有主题关系研究中没有合适的模型来生成这种领域主题层次.为了从领域文本中自动、有效地挖掘出领域主题的层次关系和关联关系,在4个方面进行创新研究.首先,通过主题共享机制改进nCRP构造方法,提出nCRP+层次构造方法,为主题模型中的主题提供具有分层主题方面共享的树形先验分布;其次,结合nCRP+和HDP模型构建重分层的Dirichlet过程,提出rHDP(reallocated hierarchical Dirichlet processes)层次主题模型;第三,结合领域分类信息、词语语义和主题词的领域代表性,定义领域知识,包括基于投票机制的领域隶属度、词语与领域主题的语义相关度和层次化的主题-词语贡献度;最后,通过领域知识改进rHDP主题模型中领域主题和主题词的分配过程,提出结合领域知识的层次主题模型rHDP_DK(rHDP with domain knowledge),并改进采样过程.实验结果表明,基于nCRP+的层次主题模型在评价指标方面均优于基于nCRP的层次主题模型(hLDA,nHDP)和神经主题模型(TSNTM);通过rHDP_DK模型生成的主题层次结构具有领域主题层次清晰、关联子主题的主题词领域差异明确的特点.此外,该模型将为领域主题层次提供一个通用的自动挖掘框架. 展开更多
关键词 层次主题模型 领域分类信息 词语语义 主题关联关系 层次化的采样过程 领域主题层次
下载PDF
GPU数据库实现技术发展演进
20
作者 刘鹏 陈红 +1 位作者 张延松 李翠平 《计算机学报》 EI CAS CSCD 北大核心 2024年第11期2691-2724,共34页
爆炸式增长的数据对存储和处理数据提出了更高的需求,GPU数据库作为新硬件数据库的一个重要分支,在大容量和高性能处理方面有其独特的优势.GPU数据库作为高性能数据库的代表,在最近几年受到学术界和产业界的关注,一批具有代表性的研究... 爆炸式增长的数据对存储和处理数据提出了更高的需求,GPU数据库作为新硬件数据库的一个重要分支,在大容量和高性能处理方面有其独特的优势.GPU数据库作为高性能数据库的代表,在最近几年受到学术界和产业界的关注,一批具有代表性的研究成果和标志性的实际产品已经出现.GPU数据库的技术发展按照GPU加速型和GPU内存型两种技术路线展开.两种技术路线都有相应的原型系统或产品出现.虽然两种GPU数据库的发展路线在实现上有所不同,但GPU数据库最基本的功能部分和核心技术是相似的,都有查询编译、查询优化、查询执行以及存储管理等功能.当前主流的数据传输方案除了PCIe之外,NVLink、RDMA和CXL等传输方案也为不同处理器之间的数据传输提供了更多的可能性.大多数GPU数据库使用列存储模型来存储数据,少数GPU数据库(如PG-Strom)对两种存储模型都支持.在列存储模型上利用压缩技术能减少数据的存储空间和传输时延.在GPU数据库上进行的压缩和解压的时间应该在整个数据处理的过程中占比很少.在GPU数据库上建立和维护索引不应该有很大的系统开销.JIT编译时间短、编译效率高,是GPU数据库编译的主流.操作符对数据库查询性能的影响非常明显,连接操作、分组聚集和OLAP运算符是目前研究最多的三个类型.目前大多数的研究中,连接和分组聚集算子通常结合在一起研究.在连接算子执行的过程中还和表的连接顺序结合在一起进行考虑.OLAP算子是GPU数据库中的又一个被大量研究的算子,GPU数据库在OLAP算子和模型方面持续受到研究者的关注.GPU数据库有三种查询处理模型,即行处理、列处理和向量化处理.向量化处理和列处理在实际系统中应用较多.由于GPU加速型数据库技术的发展,CPU-GPU协同处理模型上的查询方案与查询引擎也有一定数量的研究成果出现.当前GPU数据库的查询优化研究主要有三部分:多表连接顺序、查询重写和代价模型.然而,GPU数据库的代价评估模型在目前还没有很好的解决方案,GPU数据库的查询优化在未来仍有很大的研究空间.事务在GPU数据库中没有得到很好的研究,尽管有单独的原型系统,但目前的研究还没有取得重大进展.本文总结了GPU数据库各种关键技术已有的研究成果,指出GPU数据库当前存在的问题和面临的挑战,对未来的研究方向进行了展望. 展开更多
关键词 GPU数据库 数据压缩 算子优化 OLAP查询 查询处理
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部