期刊文献+

《计算机学报》 CSCD 北大核心

作品数6932被引量79622H指数105
《计算机学报》是中国计算机领域权威性学术刊物。其宗旨是报道中国计算机科学技术领域最高水平的科研成果。它由中国计算机学会与中国科学院计算技术研究所主办、科学出版社出版,以中文编辑形式与读者见面,同时以英...查看详情>>
  • 主办单位中国计算机学会;中国科学院计算技术研究所
  • 国际标准连续出版物号0254-4164
  • 国内统一连续出版物号11-1826/TP
  • 出版周期月刊
共找到6,932篇文章
< 1 2 250 >
每页显示 20 50 100
科学发现中的机器学习方法研究 被引量:3
1
作者 孟小峰 郝新丽 +4 位作者 马超红 杨晨 艾山·毛力尼亚孜 吴潮 魏建彦 《计算机学报》 EI CAS CSCD 北大核心 2023年第5期877-895,共19页
大规模科学装置与重大科学实验使得科学发现进入了数据密集型的第四范式,借助蓬勃发展的人工智能技术促进智能科学发现势在必行.机器学习作为人工智能中的一项重要技术,已广泛应用于各个科学领域.然而,现有工作仅研究特定任务下的机器... 大规模科学装置与重大科学实验使得科学发现进入了数据密集型的第四范式,借助蓬勃发展的人工智能技术促进智能科学发现势在必行.机器学习作为人工智能中的一项重要技术,已广泛应用于各个科学领域.然而,现有工作仅研究特定任务下的机器学习方法,没能抽象出一个通用的智能科学发现研究框架.本文首先总结了科学发现任务中常用的机器学习方法,并将科学任务归类为五大机器学习问题.其次,提出了基于机器学习的智能科学发现研究框架,作为“AI for Science”的典型范例,阐述了一种高效的智能科学发现模式.再次,本文以时域天文学中发现瞬变事件这一科学任务为例,通过实验证明了唯有恰当地结合领域知识后,机器学习算法才能更好地服务于智能科学发现,验证了该框架的有效性.最后进行总结与展望,以期对各领域进行智能科学发现形成参考意义. 展开更多
关键词 科学发现 机器学习 科学大数据 瞬变事件发现 智能科学发现
下载PDF
一种微指令序列调度数据流的星载卷积神经网络FPGA加速器
2
作者 郭子博 刘凯 +2 位作者 胡航天 李奕铎 璩泽旭 《计算机学报》 EI CAS CSCD 北大核心 2022年第10期2047-2064,共18页
卷积神经网络(Convolutional Neural Network,CNN)是目前主流视觉算法不可或缺的关键部分.为提高CNN模型推理速度,学界提出了众多异构加速方法以满足不同场景下的多元加速需求.但如何在资源与能耗受限的在轨卫星上稳定高效地加速CNN仍... 卷积神经网络(Convolutional Neural Network,CNN)是目前主流视觉算法不可或缺的关键部分.为提高CNN模型推理速度,学界提出了众多异构加速方法以满足不同场景下的多元加速需求.但如何在资源与能耗受限的在轨卫星上稳定高效地加速CNN仍是极具挑战的课题.为此,本文通过软硬件协同设计,着力优化微指令编码、指令级并行和运算级并行3个加速器设计的关键部分,在星上常见的Xilinx VX690T FPGA芯片上设计实现了一种微指令序列调度数据流的CNN加速器.在软件层面,本文提出一种可扩展的微指令编码格式及相应的编译方法.通过卷积循环分块和算子融合策略实现图级别优化,生成加速器可执行的微指令序列.在硬件层面,本文设计实现了一个由微控制器与逻辑运算器组成的RTL级CNN加速器.微控制器通过粗粒度流水线实现各类指令的并行执行.逻辑运算器通过DSP48E1计算资源级联所构建的计算阵列实现卷积算子的细粒度并行运算.实验结果表明,加速器设计功耗10.68 W,在加速YOLOV3Tiny算法时,峰值吞吐率(Runtime Max Throughput,RMT)达到378.63 GOP/s,计算资源利用效率(MAC Efficiency,ME)达到91.5%.相较典型GPU加速方法,本文的加速器有14倍能效提升.相较同类FPGA加速器,ME有6.9%以上的提升. 展开更多
关键词 卷积神经网络 微指令序列 现场可编程逻辑门阵列 遥感目标检测 微处理器设计
下载PDF
公平机器学习:概念、分析与设计 被引量:15
3
作者 古天龙 李龙 +1 位作者 常亮 罗义琴 《计算机学报》 EI CAS CSCD 北大核心 2022年第5期1018-1051,共34页
随着人工智能的发展,机器学习技术越来越多地应用于社会各个领域,用以辅助或代替人们进行决策,特别是在一些具有重要影响的领域,例如,信用程度评级、学生质量评估、福利资源分配、疾病临床诊断、自然语言处理、个性信息推荐、刑事犯罪... 随着人工智能的发展,机器学习技术越来越多地应用于社会各个领域,用以辅助或代替人们进行决策,特别是在一些具有重要影响的领域,例如,信用程度评级、学生质量评估、福利资源分配、疾病临床诊断、自然语言处理、个性信息推荐、刑事犯罪判决、无人驾驶等.如何在这些应用中确保决策公平或者无偏见?如何在这些应用中保护弱势群体的利益?这些问题直接影响到社会和公众对机器学习的信任,影响到人工智能技术的应用与系统的部署.通过系统梳理和全面剖析近年来的工作,对机器学习公平性或公平机器学习的定义及度量进行了解释及对比;从机器学习的全生命周期出发,对不同环节中出现的各类偏见及其发现技术进行了归类及阐释;从预处理、中间处理和后处理三个阶段,对公平机器学习的设计技术进行了介绍和分析;从可信赖人工智能全局出发,对公平性与隐私保护、可解释性之间的关系、影响及协同解决方案进行了阐述;最后对公平机器学习领域中亟待解决的主要问题、挑战及进一步研究热点进行了讨论. 展开更多
关键词 机器学习 公平性 隐私保护 可解释 人工智能伦理
下载PDF
DB4Trans:数据库内置知识图谱嵌入模型训练引擎
4
作者 柳鹏凯 王鑫 +2 位作者 刘宝珠 蔡顺汀 李思卓 《计算机学报》 EI CAS CSCD 北大核心 2022年第9期1969-1982,共14页
知识图谱嵌入技术将知识图谱中的实体和关系嵌入到连续的向量空间中,在简化图谱操作的同时保留知识图谱的固有结构,并有助于完成诸如图谱补全、链接预测等下游任务.随着基于知识的人工智能的日益普及和应用,知识图谱的数据规模正在急剧... 知识图谱嵌入技术将知识图谱中的实体和关系嵌入到连续的向量空间中,在简化图谱操作的同时保留知识图谱的固有结构,并有助于完成诸如图谱补全、链接预测等下游任务.随着基于知识的人工智能的日益普及和应用,知识图谱的数据规模正在急剧增加.然而,大部分的知识图谱嵌入工作主要关注模型训练的结果,忽略了对于数据规模的可扩展性,在处理大规模知识图谱时表现出较差的性能.近年来的一些研究工作将数据库技术应用于机器学习算法的优化,同时提供了用于数据库内机器学习的各类工具.通过将知识图谱嵌入模型与数据库在数据管理上的优势进行有效的结合,能够在保证知识图谱嵌入模型训练的准确率和效率的同时,提供更好的可扩展性以支持大规模知识图谱数据的训练.基于此,本文提出一种数据库内置知识图谱嵌入模型训练引擎DB4Trans.首先,设计了一种用于知识图谱嵌入模型训练的数据存储方案,对实体和关系进行编码并建立索引结构,以实现模型训练过程中对中间结果的快速访问和更新;其次,提出了一种数据库内置的模型训练优化算法,对数据库与内存间的数据批量交换方案进行设计以支持大规模数据的训练与存储;最后,在不同数据集上进行了测试,比较了模型训练与预测的时间、模型训练的准确率、存储时间和空间效率并验证了方法的可扩展性.实验结果表明,所提出的方法能够在不影响模型训练效率和准确率的同时,通过内存与数据库间的数据交换,支持在数据库内完成大规模知识图谱的训练过程. 展开更多
关键词 数据库 知识图谱嵌入 模型训练引擎 DB4AI TransE
下载PDF
基于渐进式双网络模型的低曝光图像增强方法 被引量:16
5
作者 黄淑英 胡威 +2 位作者 杨勇 李红霞 汪斌 《计算机学报》 EI CSCD 北大核心 2021年第2期384-394,共11页
传统的图像增强方法对低曝光图像进行增强时,通常只考虑到了亮度的提升,忽略了增强过程中带来的噪声放大问题.而当前基于深度学习的方法利用端到端的网络直接学习低曝光图像到正常图像的映射关系,忽略了低曝光图像形成的物理原理,也没... 传统的图像增强方法对低曝光图像进行增强时,通常只考虑到了亮度的提升,忽略了增强过程中带来的噪声放大问题.而当前基于深度学习的方法利用端到端的网络直接学习低曝光图像到正常图像的映射关系,忽略了低曝光图像形成的物理原理,也没有考虑解决噪声放大的问题.针对上述问题,本文通过对图像降质的本质原因进行分析,提出一种基于渐进式双网络模型的低曝光图像增强方法,该方法包含图像增强模块以及图像去噪模块两个部分.对每个模块的构建也采用了渐进式的思想,考虑了图像由暗到亮的亮度变化,以及从粗到细的图像恢复过程,使增强后的结果更接近真实图像.为了更好地训练网络,本文构建了一种双向约束损失函数,从图像降质模型的正反两个方向使网络学习结果逼近真实数据,达到动态平衡.为了验证本文方法的有效性,本文与一些主流的方法从主观和客观两方面进行了实验对比,实验结果证明了本文方法得到的结果更接近真实图像,获得了更优的性能指标. 展开更多
关键词 低曝光图像增强 渐进式 双网络 双向约束损失函数
下载PDF
元学习研究综述 被引量:51
6
作者 李凡长 刘洋 +3 位作者 吴鹏翔 董方 蔡奇 王哲 《计算机学报》 EI CSCD 北大核心 2021年第2期422-446,共25页
深度学习在大量领域取得优异成果,但仍然存在着鲁棒性和泛化性较差、难以学习和适应未观测任务、极其依赖大规模数据等问题.近两年元学习在深度学习上的发展,为解决上述问题提供了新的视野.元学习是一种模仿生物利用先前已有的知识,从... 深度学习在大量领域取得优异成果,但仍然存在着鲁棒性和泛化性较差、难以学习和适应未观测任务、极其依赖大规模数据等问题.近两年元学习在深度学习上的发展,为解决上述问题提供了新的视野.元学习是一种模仿生物利用先前已有的知识,从而快速学习新的未见事物能力的一种学习定式.元学习的目标是利用已学习的信息,快速适应未学习的新任务.这与实现通用人工智能的目标相契合,对元学习问题的研究也是提高模型的鲁棒性和泛化性的关键.近年来随着深度学习的发展,元学习再度成为热点,目前元学习的研究百家争鸣、百花齐放.本文从元学习的起源出发,系统地介绍元学习的发展历史,包括元学习的由来和原始定义,然后给出当前元学习的通用定义,同时总结当前元学习一些不同方向的研究成果,包括基于度量的元学习方法、基于强泛化新的初始化参数的元学习方法、基于梯度优化器的元学习方法、基于外部记忆单元的元学方法、基于数据增强的元学方法等.总结其共有的思想和存在的问题,对元学习的研究思想进行分类,并叙述不同方法和其相应的算法.最后论述了元学习研究中常用数据集和评判标准,并从元学习的自适应性、进化性、可解释性、连续性、可扩展性展望其未来发展趋势. 展开更多
关键词 元学习 深度学习 深度神经网络 泛化能力 自适应能力 扩展能力
下载PDF
《计算机学报》编辑委员会
7
《计算机学报》 EI CSCD 北大核心 2021年第3期I0001-I0001,共1页
下载PDF
基于手工特征提取与结果融合的CNN音频隐写分析算法 被引量:4
8
作者 李敬轩 胡润文 +1 位作者 阮观奇 项世军 《计算机学报》 EI CAS CSCD 北大核心 2021年第10期2061-2075,共15页
随着互联网技术的快速发展,出现了基于IP的语音传输技术,给人们带来方便的同时也带来了许多安全隐患,如不法分子利用VoIP压缩域语音传输协议传送秘密信息.因此,针对基于G.729A编码的基音隐写算法和互补邻居顶点的量化索引调制音频隐写算... 随着互联网技术的快速发展,出现了基于IP的语音传输技术,给人们带来方便的同时也带来了许多安全隐患,如不法分子利用VoIP压缩域语音传输协议传送秘密信息.因此,针对基于G.729A编码的基音隐写算法和互补邻居顶点的量化索引调制音频隐写算法,本文提出了一种基于手工特征提取与结果融合的卷积神经网络音频隐写分析算法.通过将手工提取特征与卷积神经网络相结合,可以实现在VoIP压缩域同时对基于基音的隐写算法和互补邻居顶点的量化索引调制音频隐写算法进行有效检测.实验结果表明,在同时对基音隐写算法和互补邻居顶点的量化索引调制音频隐写算法进行检测时,本文所提出的基于手工特征提取与结果融合的卷积神经网络音频隐写分析算法的检测准确率可以达到86.2%(嵌入率为100%、音频样本时长为0.1s).与现有隐写分析算法相比,在音频时长较短时,本文所提算法取得了优异的检测结果. 展开更多
关键词 隐写分析 G.729A 卷积神经网络 手工特征提取 结果融合
下载PDF
基于模糊C均值聚类的软件多缺陷定位方法 被引量:8
9
作者 王兴亚 姜淑娟 +4 位作者 高鹏飞 陆凯 薄莉莉 鞠小林 张艳梅 《计算机学报》 EI CSCD 北大核心 2020年第2期206-232,共27页
缺陷间的相互干扰会使程序的频谱信息和运行结果发生变化,进而影响基于频谱信息的缺陷定位方法(SBFL)的有效性.本文对缺陷干扰现象进行了研究,通过分析单缺陷程序与多缺陷程序在缺陷运行、感染和传播过程及程序运行结果间的差异定义了... 缺陷间的相互干扰会使程序的频谱信息和运行结果发生变化,进而影响基于频谱信息的缺陷定位方法(SBFL)的有效性.本文对缺陷干扰现象进行了研究,通过分析单缺陷程序与多缺陷程序在缺陷运行、感染和传播过程及程序运行结果间的差异定义了两类缺陷干扰,并根据干扰前后缺陷在互斥子集中的分布变化分析了缺陷干扰对SBFL方法有效性的影响.研究结果表明:与特定缺陷无关的失败测试用例是降低SBFL方法缺陷定位有效性的主要原因.在此基础上,本文提出了一种基于模糊C均值聚类的多缺陷定位方法FCMFL:首先,通过模糊C均值聚类分析失败测试用例与不同缺陷间的隶属关系,得到每个缺陷相关的失败测试信息;其次,基于隶属度矩阵加权计算每条语句的可疑度,并通过互斥子集优先级分析确定不同语句集合的检查顺序,最终生成一个语句检查序列指导开发人员进行程序调试.实验结果表明:(1)缺陷干扰会对SBFL方法产生影响,降低SBFL方法的缺陷定位有效性;(2)FCMFL方法可以降低多缺陷对SBFL方法的影响,提高SBFL方法的缺陷定位有效性. 展开更多
关键词 程序调试 缺陷定位 程序切片 缺陷干扰 模糊聚类
下载PDF
极限学习机前沿进展与趋势 被引量:101
10
作者 徐睿 梁循 +2 位作者 齐金山 李志宇 张树森 《计算机学报》 EI CSCD 北大核心 2019年第7期1640-1670,共31页
极限学习机(Extreme Learning Machine,ELM)作为前馈神经网络学习中一种全新的训练框架,在行为识别、情感识别和故障诊断等方面被广泛应用,引起了各个领域的高度关注和深入研究.ELM最初是针对单隐层前馈神经网络的学习速度而提出的,之... 极限学习机(Extreme Learning Machine,ELM)作为前馈神经网络学习中一种全新的训练框架,在行为识别、情感识别和故障诊断等方面被广泛应用,引起了各个领域的高度关注和深入研究.ELM最初是针对单隐层前馈神经网络的学习速度而提出的,之后又被众多学者扩展到多隐层前馈神经网络中.该算法的核心思想是随机选取网络的输入权值和隐层偏置,在训练过程中保持不变,仅需要优化隐层神经元个数.网络的输出权值则是通过最小化平方损失函数,来求解Moore - Penrose广义逆运算得到最小范数最小二乘解.相比于其它传统的基于梯度的前馈神经网络学习算法,ELM具有实现简单,学习速度极快和人为干预较少等显著优势,已成为当前人工智能领域最热门的研究方向之一.ELM的学习理论表明,当隐层神经元的学习参数独立于训练样本随机生成,只要前馈神经网络的激活函数是非线性分段连续的,就可以逼近任意连续目标函数或分类任务中的任何复杂决策边界.近年来,随机神经元也逐步在越来越多的深度学习中使用,而ELM可以为其提供使用的理论基础.本文首先概述了ELM的发展历程,接着详细阐述了ELM的工作原理.然后对ELM理论和应用的最新研究进展进行了归纳总结,着重讨论并分析了自ELM提出以来的主要学习算法和模型,包括提出的原因、核心思想、求解方法、各自的优缺点以及相关问题.最后,针对当前的研究现状,指出了ELM存在的争议、问题和挑战,并对未来的研究方向和发展趋势进行了展望。 展开更多
关键词 极限学习机 网络结构 正则化 核学习 深度学习 在线学习 并行计算
下载PDF
图划分在混合内存系统的实现与性能优化
11
作者 李琪 钟将 李雪 《计算机学报》 EI CSCD 北大核心 2019年第11期2481-2498,共18页
图划分是大图数据并行计算的基础,目前主要采用分布式算法实现大图划分.非易失存储器(Non-Volatile Memory,NVM)速度接近动态随机存储器(Dynamic Random Access Memory,DRAM),且具有低功耗、高密度、低时延等优点,本文针对分布式图划分... 图划分是大图数据并行计算的基础,目前主要采用分布式算法实现大图划分.非易失存储器(Non-Volatile Memory,NVM)速度接近动态随机存储器(Dynamic Random Access Memory,DRAM),且具有低功耗、高密度、低时延等优点,本文针对分布式图划分算法难以分析和调试等问题,设计了基于混合内存的单机图划分算法框架.作者提出了基于邻边结构的图划分结果动态缓存管理策略(AeFdy),以提高缓存区邻居节点的搜索效率.在17种真实应用数据上的实验结果表明,采用新方法的平均图划分速度是基于邻点结构算法的4.9倍.本文还针对NVM寿命有限的问题,设计了基于内存页读写特征的迁移算法,实现了NVM写操作受限条件下的迁移优化方案.相对于Linux Swap、M-CLOCK、Dr.Swap混合内存管理策略,使用AeFdy策略的性能分别提升了128.5%、87.4%与50.4%.仿真实验结果表明,本文设计的混合内存管理方法实现了NVM+DRAM高效协同. 展开更多
关键词 复杂网络 非易失存储器 流划分 混合内存 内存计算 平衡图划分
下载PDF
一种新型的混合异构口令恢复系统 被引量:2
12
作者 李斌 周清雷 斯雪明 《计算机学报》 EI CSCD 北大核心 2018年第12期2804-2822,共19页
口令恢复作为电子取证、信息情报获取和犯罪记录审查的重要手段,是对互联网信息进行监控、维护网络信息安全的关键环节之一.传统的口令恢复系统主要以CPU和GPU为主,体系结构单一、破解效率低,无法满足用户的计算需求.由此,该文提出了一... 口令恢复作为电子取证、信息情报获取和犯罪记录审查的重要手段,是对互联网信息进行监控、维护网络信息安全的关键环节之一.传统的口令恢复系统主要以CPU和GPU为主,体系结构单一、破解效率低,无法满足用户的计算需求.由此,该文提出了一种新型的混合异构口令恢复系统.结合拟态计算的思想,通过CPU、GPU和拟态计算机搭建混合异构系统,建立多维可重构体系.并在拟态计算机上设计相关高速口令穷举算法、万兆网络字典传输协议和全流水可重构加密恢复算法,提高破解效率.同时,根据具体口令恢复应用的PMC(Processing-Memory-Communication)特征,动态调整系统结构,均衡向下分配口令空间,使整个系统高效地完成加密恢复任务.实验分析和结果表明,与传统CPU系统相比,该文系统在破解速度上提高18.84倍~84.94倍,在能效比上提高3.07倍~15.73倍,与传统口令穷举和字典破解模式相比,其恢复效率有所提升,且能较好地支持异构系统. 展开更多
关键词 拟态计算 拟态计算机 口令恢复 混台异构 口令穷举 字典传输 负载均衡
下载PDF
基于分类的微博新情感词抽取方法和特征分析 被引量:18
13
作者 刘德喜 聂建云 +5 位作者 万常选 刘喜平 廖述梅 廖国琼 钟敏娟 江腾蛟 《计算机学报》 EI CSCD 北大核心 2018年第7期1574-1597,共24页
情感或情绪分析在舆情分析、商品评论分析、商品推荐等领域应用广泛,而文本中的情感或情绪分析通常以情感词典为基础.人工情感词典虽然准确但构建代价大、难以及时更新,很难适应微博这类新情感词快速更迭的数据.微博平台为新情感词的发... 情感或情绪分析在舆情分析、商品评论分析、商品推荐等领域应用广泛,而文本中的情感或情绪分析通常以情感词典为基础.人工情感词典虽然准确但构建代价大、难以及时更新,很难适应微博这类新情感词快速更迭的数据.微博平台为新情感词的发布和传播提供了便捷的途径,是新情感词的重要来源.考虑到已有规模较大的人工情感词典及大量包含新情感词的微博数据,在统计、分析、对比中、英两种语言微博中情感词分布差异的基础上,提出了与特定语言无关的基于分类思想的微博新情感词抽取方法cNSEm.cNSEm根据微博数据集和情感词典自动构建训练数据、训练分类器并判别候选词的情感极性,最后采用投票机制确定候选词的情感极性.通过大量而细致的实验,分析了cNSEm在中、英文两种语言的微博数据上的表现、六类特征的作用和用法以及抽取的新情感词对微博情感分类任务的帮助作用.实验结果表明,cNSEm比经典的基于共现和极性传播的方法要好,特别是当考虑中文微博数据集中的名词类情感词时.对cNSEm抽取的新情感词进行了直接和间接两种方法评测,前者利用人工情感词典作参照,后者考察抽取的新情感词对情感分类的帮助作用,从评测指标上看,cNSEm抽取的新情感词与人工情感词典的质量相当,并且cNSEm能适应有较大差异的中、英两个语种. 展开更多
关键词 微博 新情感词抽取 cNSEm方法 特征分析
下载PDF
一种滑动窗口下数据流Disjoint查询的增量处理算法 被引量:2
14
作者 王少鹏 闻英友 +1 位作者 赵宏 孟颍辉 《计算机学报》 EI CSCD 北大核心 2017年第10期2381-2403,共23页
对于滑动窗口下不具有全局约束机制的数据流Disjoint查询精确处理问题进行了研究,在现有FSM算法基础上提出了一种具有增量计算特征的查询处理算法DQPIC.该算法使用FSM算法处理第一个窗口中的数据流成员,同时保留了该窗口上的查询结果和... 对于滑动窗口下不具有全局约束机制的数据流Disjoint查询精确处理问题进行了研究,在现有FSM算法基础上提出了一种具有增量计算特征的查询处理算法DQPIC.该算法使用FSM算法处理第一个窗口中的数据流成员,同时保留了该窗口上的查询结果和窗口所对应STWM的最后一个列向量,除此之外还需要保留窗口STWM中所有列向量第curbound.highest个成员DTW路径的起始位置、距离值以及该成员在STWM中对应列向量的dmin值和候选查询结果这些信息.从第二个窗口开始,继续使用FSM算法处理窗口成员,同时也保留和第一个窗口一样的信息.在这个过程中,当处理相邻窗口中相同数据流成员时,通过比较该成员在前后两个窗口中分别对应的保留信息是否相同,可以确定算法有无继续处理剩余相同数据流成员的必要,能够在前一个窗口查询结果基础上增量地获得当前窗口查询结果.基于公用数据样本SST与Maskedchirp的仿真实验验证了该算法的有效性.提出的算法与现有其他算法执行结果相同,在空间开销增加1.12~3.27倍情况下,可以实现时间效率2.5~25倍的提高,对于与大窗口下的Disjoint查询相关应用场景,具有更好的时间效果. 展开更多
关键词 数据流 动态时间扭曲 Disjoint查询 滑动窗口 增量计算
下载PDF
面向社会化媒体用户评论行为的属性推断 被引量:7
15
作者 刘云 孙宇清 李明珠 《计算机学报》 EI CSCD 北大核心 2017年第12期2762-2776,共15页
针对用户网络行为进行属性推断,在个性化推荐、市场营销和提升平台服务质量等方面具有重要应用价值.现有工作主要针对浏览行为、社交行为等可追踪用户身份的网络行为进行属性推断,而评论性网站用户多为匿名身份,其网络评论行为数据具有... 针对用户网络行为进行属性推断,在个性化推荐、市场营销和提升平台服务质量等方面具有重要应用价值.现有工作主要针对浏览行为、社交行为等可追踪用户身份的网络行为进行属性推断,而评论性网站用户多为匿名身份,其网络评论行为数据具有碎片化、信息价值含量低和不平衡的特点,且用户群体的属性分布严重不均衡,这些问题给用户属性推断带来挑战.文中引入客体信息、环境信息和语义知识库,辅助用户特征建模,增加了用户评论行为的语义内涵,缓解了用户行为数据量不平衡性和稀疏性问题;基于信息增益度量特征,提出了面向概率性特征选择的两种代表性算法的改进策略:概率包裹式特征选择和启发式概率特征搜索,在解决特征空间高维问题,提高效率的同时,降低了数据噪音影响;提出了面向小比例类型数据的差异性特征选择和迭代式增强学习算法,集成多个特征相关的分类器,既保留了重要特征信息,也给低价值特征提供了小概率选择机会.分别使用真实的中文和英文数据集验证该文方法,包括不同的行为建模方式和特征筛选方法,以及不同参数和用户属性分布不平衡问题对属性推断的影响,并和其他方法进行了对比,实验结果表明该文方法更为有效. 展开更多
关键词 社会化媒体 属性推断 语义分析 用户行为 概率特征选择 社交网络
下载PDF
基于天河2高速互连网络实现混合层次文件系统H^2FS高速通信 被引量:7
16
作者 董勇 周恩强 +1 位作者 卢宇彤 张伟 《计算机学报》 EI CSCD 北大核心 2017年第9期1961-1979,共19页
高效通信性能是影响并行文件系统性能与效率的重要因素.该文基于TH-2系统的高性能互连网络——天河2高速互连网络(TH-Express 2),设计并实现了混合层次文件系统H^2FS中的高速通信模块FSE.FSE采用了TH-Express 2的短报文通信MP和远程内... 高效通信性能是影响并行文件系统性能与效率的重要因素.该文基于TH-2系统的高性能互连网络——天河2高速互连网络(TH-Express 2),设计并实现了混合层次文件系统H^2FS中的高速通信模块FSE.FSE采用了TH-Express 2的短报文通信MP和远程内存访问RDMA相结合的方式,实现客户端与ION的通信.FSE采用基于动态链表的内存注册池减少通信延迟,提高通信效率.基于可变信用的流量控制,FSE有效降低系统出现拥塞的可能性,提高系统的可扩展性和稳定性.为了充分利用多核处理器的并发处理能力以及多RDMA引擎的传输能力,FSE对报文传输和数据处理功能采用了多维多线程方式,提高数据访问带宽.FSE的自适应端点管理针对通信端点容错能力设计,提高了系统弹性,有助于增强系统稳定性.FSE实现优化了数据传输效率,实现了低延迟、高带宽、高可扩展数据访问.在两个不同实际系统上的测试结果表明,FSE可以充分发掘TH-Express 2的特性,点点数据访问带宽可达8.6Gbps,使得H^2FS具有较高的数据访问带宽和元数据性能,并具有良好的可扩展性.同基于TCP的通信模块实现相比,FSE的读写延迟可低至55%和20%,最大单ION写性能是其3.3倍;同Lustre文件系统相比,FSE更好地利用了高速网的特性来获取较高性能,写延迟可低至其28.6%. 展开更多
关键词 混合层次文件系统 H^2FS FSE 天河2高速互连网络
下载PDF
基于属性提升与局部采样的推荐评分预测 被引量:6
17
作者 郑麟 朱福喜 姚杏 《计算机学报》 EI CSCD 北大核心 2016年第8期1501-1514,共14页
评分预测问题是推荐系统研究的一个分支.在上下文感知推荐(Context-Aware Recommendation,CAR)中,常常需要考虑上下文因子(或称属性)对评分预测效果的影响.现有模型大多是捕捉单个属性的特征并加上多个属性间的相互作用(简称属性交互)... 评分预测问题是推荐系统研究的一个分支.在上下文感知推荐(Context-Aware Recommendation,CAR)中,常常需要考虑上下文因子(或称属性)对评分预测效果的影响.现有模型大多是捕捉单个属性的特征并加上多个属性间的相互作用(简称属性交互)实现评分预测.然而,有些算法在捕捉属性间的相互作用时没有针对性,使一些属性交互对预测结果没有帮助,甚至降低模型性能;而且,在实现属性交互时,很多算法只是单纯地使用固定的属性值,没有从某个方面挖掘出它们的潜在特征.为了解决这些问题,文中提出了属性提升(Attribute Boosting,AB)框架,从用户、物品与属性类型3个方面分别与属性进行交互.这种更精细的建模方式使属性能够自动地适应用户偏好、物品关联与类型特征,并能在评分预测中充分地发挥作用.在此基础上,文中结合概率图模型的低秩近似能力和随机梯度下降(Stochastic Gradient Descent,SGD)的快速训练优势,在算法性能和训练效率上进行权衡,设计了局部采样(Partial Sampling,PS)方法学习属性提升框架的参数,最终构成完整的属性提升与局部采样(Attribute Boosting with Partial Sampling,ABPS)模型.实验证明,ABPS模型通过有针对性的属性交互,能有效地挖掘出属性有用的隐含特征,从而减少盲目交互带来的消极影响;利用局部采样,该模型能使用更低的特征维度描述个性化信息,取得比其他模型更好的效果. 展开更多
关键词 推荐系统 上下文感知推荐 评分预测 属性提升 局部采样 数据挖掘
下载PDF
形状图理论的定理证明 被引量:4
18
作者 张昱 陈意云 李兆鹏 《计算机学报》 EI CSCD 北大核心 2016年第12期2460-2480,共21页
验证操作易变数据结构的指针程序仍面临很多挑战.数据结构中严重的指针别名显著地复杂化对操作这些结构的程序的推理.为分析和验证操作易变数据结构的指针程序,文中提出了形状图逻辑.形状图是描述程序中静态声明的堆指针变量和动态分配... 验证操作易变数据结构的指针程序仍面临很多挑战.数据结构中严重的指针别名显著地复杂化对操作这些结构的程序的推理.为分析和验证操作易变数据结构的指针程序,文中提出了形状图逻辑.形状图是描述程序中静态声明的堆指针变量和动态分配的结构体中指针域变量的指向的一种有向图,能准确表达指针的有效性和指针之间的相等性,可用于判断两个访问表达式是否是别名.形状图逻辑是Hoare逻辑的一种扩展,是一种直接将形状图作为程序中指针断言集的程序逻辑.该文研究形状图的等价理论和蕴含理论以及它们的判定方法和应用.首先,把形状图及其等价规则和蕴含规则分别类比为代数项及其等式规则和重写规则,像研究代数规范的理论那样来研究形状图理论.该文定义了形状图的语法理论和语义理论,定义了形状图重写系统及其终止性、局部合流性和合流性,然后得到基于形状图重写的形状图等价判定和蕴含判定的方法.其次,提出循环不变形状图和递归函数前后形状图的自动推断方法.借助形状图理论的判定方法,该文把一个基于抽象解释的推断循环不变式的一般方法改编成推断循环不变形状图的方法.由于计算终止的递归函数总有非递归的出口,可以先通过非递归路径得到函数的后形状图的初值,然后再在递归路径上迭代求解.从而,可以像推断循环不变形状图那样来推断递归函数的前后形状图.第三,参照Nelson-Oppen框架,提出形状图理论和整数理论组合的一种判定方法.对易变数据结构,除了关心数据结构各节点是否连成预定的形状外,往往还关心数据在这些节点间的排列等特性,它们不能脱离易变数据结构的形状特征而单独验证.为此,所提出的组合判定方法针对这类程序的验证条件的特点,利用程序分析阶段得到的形状图对验证条件的前件中的符号断言按形状图的节点分组;然后运用整数理论为各节点推导出尽可能多的性质;最后才交由定理证明器Z3去自动验证.这种方式有效地避免验证条件证明过程的不终止.基于形状图逻辑以及文中的工作,我们所开发的程序验证系统原型减轻了自动定理证明器的负担,并且能验证易变数据结构上较为复杂的程序,如有序循环双向链表、二叉排序树、伸展树、树堆、二叉平衡树和AA树的插入和删除函数. 展开更多
关键词 形状图逻辑 形状分析 程序验证 自动定理证明 循环不变式的推断
下载PDF
圆柱形硅通孔的二维解析电容模型 被引量:2
19
作者 张青青 喻文健 骆祖莹 《计算机学报》 EI CSCD 北大核心 2014年第7期1521-1527,共7页
精确提取三维芯片中硅通孔(Through Silicon Via,TSV)电容在三维芯片设计中至关重要.使用后钻孔工艺(Via-last technology)制造的TSV将贯穿导体层,使得TSV和互连线之间的耦合电容需要精确建模.文中提出的解析公式方法可以快速提取圆柱形... 精确提取三维芯片中硅通孔(Through Silicon Via,TSV)电容在三维芯片设计中至关重要.使用后钻孔工艺(Via-last technology)制造的TSV将贯穿导体层,使得TSV和互连线之间的耦合电容需要精确建模.文中提出的解析公式方法可以快速提取圆柱形TSV与互连线间的二维耦合电容.对于较短的互连线,文中采用基于最小二乘拟合得到的解析公式,而对于较长的互连线,使用基于电场模拟得到的解析公式.数值实验表明和商业软件Raphael相比,文中方法可以在结果误差不超过9.1%的情况下获得至少三千倍的加速. 展开更多
关键词 圆柱形硅通孔 三维芯片 解析模型 电容提取
下载PDF
L(k)-index:一种支持标签路径的高效k双拟结构索引
20
作者 李晓光 宋宝燕 +1 位作者 于戈 王大玲 《计算机学报》 EI CSCD 北大核心 2014年第8期1732-1742,共11页
针对基于k双拟的结构索引创建和更新低效问题、查询结果重复验证问题以及标签路径不可获得性问题,提出了一种新的结构索引L(k)-index.L(k)-index通过引入标签路径,在创建时无须k次遍历原数据,并采取批量更新策略,大大提高索引创建和更... 针对基于k双拟的结构索引创建和更新低效问题、查询结果重复验证问题以及标签路径不可获得性问题,提出了一种新的结构索引L(k)-index.L(k)-index通过引入标签路径,在创建时无须k次遍历原数据,并采取批量更新策略,大大提高索引创建和更新的效率,而在空间上仅有很小增加.对于长度大于k+1的路径查询,L(k)-index无须访问原数据进行验证,并支持批量节点的标签路径获得.通过大量实验表明,同A(k)-index相比,L(k)-index创建时间平均提高66.7%,查询处理时间效率平均提高68.9%,批量更新效率平均每节点提高58.8%,而空间仅增加22.5%. 展开更多
关键词 k双拟结构索引 XML索引 标签路径 XML查询 XML检索
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部