期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
中文微博数据净化算法比较研究
1
作者 邹鸿程 周刚 +1 位作者 杨亚强 李旭东 《计算机工程》 CAS CSCD 2012年第20期41-44,48,共5页
针对微博语言口语化和不规范导致微博数据质量低下的问题,利用质心、度-中心值和特征向量-中心值3种算法对微博话题数据进行净化,从而提高数据质量。通过比较净化前后话题帖子的规范性、相关性和有益性等属性指标分析算法性能。实验结... 针对微博语言口语化和不规范导致微博数据质量低下的问题,利用质心、度-中心值和特征向量-中心值3种算法对微博话题数据进行净化,从而提高数据质量。通过比较净化前后话题帖子的规范性、相关性和有益性等属性指标分析算法性能。实验结果表明,经过3种净化算法处理,话题帖子的整体质量尤其是规范性指标均有所提高,质心算法对于有益性指标有较好的净化效果,度-中心值和特征向量-中心值算法有助于得到强相似度的话题帖子。 展开更多
关键词 微博 质量指标 过滤 中心值 数据净化
下载PDF
MB-SinglePass:基于组合相似度的微博话题检测 被引量:24
2
作者 周刚 邹鸿程 +1 位作者 熊小兵 黄永忠 《计算机科学》 CSCD 北大核心 2012年第10期198-202,共5页
话题检测技术在传统媒体的研究中取得了较好的效果。探讨了针对微博类的新型媒体短文本对象话题检测技术的优化及性能评价。基于微博中联系人存在的关注和粉丝等结构化信息、帖子之间转发评论等内在关联关系,提出了针对微博的MB-SingleP... 话题检测技术在传统媒体的研究中取得了较好的效果。探讨了针对微博类的新型媒体短文本对象话题检测技术的优化及性能评价。基于微博中联系人存在的关注和粉丝等结构化信息、帖子之间转发评论等内在关联关系,提出了针对微博的MB-SinglePass话题检测算法。该算法除了考虑微博上述特点之外,还针对短文本特征稀疏的问题,利用同义词典,引入了微博特征扩展技术,丰富了特征信息。同时,针对单一使用余弦相似度、雅各比相似度和语义相似度的不足,采用了组合相似度策略。相较传统算法,MB-SinglePass算法在新浪微博实测数据集上取得了更好的性能。另外,针对相似度策略的对照实验说明采用组合相似度的效果优于单一相似度。 展开更多
关键词 微博 SinglePass 话题检测 文本相似度 同义词扩展
下载PDF
网站指纹识别与防御研究综述 被引量:1
3
作者 邹鸿程 苏金树 +3 位作者 魏子令 赵宝康 夏雨生 赵娜 《计算机学报》 EI CAS CSCD 北大核心 2022年第10期2243-2278,共36页
随着互联网的普及,人们越来越多地通过浏览网站获取消息、社交娱乐或者从事商业活动.用户的浏览兴趣往往暴露了个人的隐私.为了保护自己的浏览隐私,人们开始通过集成了隐私增强技术的网络来访问网站.然而,网站指纹识别与防御的研究成果... 随着互联网的普及,人们越来越多地通过浏览网站获取消息、社交娱乐或者从事商业活动.用户的浏览兴趣往往暴露了个人的隐私.为了保护自己的浏览隐私,人们开始通过集成了隐私增强技术的网络来访问网站.然而,网站指纹识别与防御的研究成果表明通过隐私增强技术来保护用户访问网站的隐私已不再安全.因此,该研究引发了学术界和产业界的广泛关注.为此,本文以系统化网站指纹研究为目标和牵引,围绕网站指纹研究的最新成果,首先概述了网站指纹研究的基本概念、识别假设、威胁模型、防御模型和研究意义,随后分两节分别详细论述了网站指纹识别和防御的评价指标、分类方法和主要研究成果.在此基础上,本文对网站指纹识别和防御的相关研究分为主体研究和辅助研究两个方面进行论述,置重点于主体研究部分.具体地,在识别方向,对其主体研究即识别方法按照相似度判别法、传统机器学习方法和深度学习方法等三种类别展开阐述,再进一步细分为具体的数学模型进行讨论分析;在防御方向,对其主体研究即防御方法则按照网络层防御、应用层防御和复合层防御进行划分,然后根据各种防御方法具体使用的防御模式进行二次分类,并进行比较综述.最后,本文提出了网站指纹研究面临的三大挑战,并对未来的研究方向进行了展望. 展开更多
关键词 网络空间安全 网站指纹 流量分析 隐私保护 应用安全
下载PDF
匿名通信系统隐藏服务定位技术研究综述 被引量:4
4
作者 赵娜 苏金树 +2 位作者 赵宝康 韩彪 邹鸿程 《计算机学报》 EI CAS CSCD 北大核心 2022年第2期393-411,共19页
匿名通信系统诞生之初是为了保护通信实体身份的匿名性和网络中通信内容的隐私性、完整性,但随着匿名通信系统的广泛使用,其匿名性不断增强,在隐藏服务技术的支持下,匿名通信系统被不法分子滥用的情况愈演愈烈,在匿名通信系统隐藏服务... 匿名通信系统诞生之初是为了保护通信实体身份的匿名性和网络中通信内容的隐私性、完整性,但随着匿名通信系统的广泛使用,其匿名性不断增强,在隐藏服务技术的支持下,匿名通信系统被不法分子滥用的情况愈演愈烈,在匿名通信系统隐藏服务技术支持下的暗网平台已然成为了“法外之地”.站在网络监管部门的立场上,对匿名通信系统,尤其是匿名通信系统隐藏服务及其定位技术的研究是必要且紧迫的.在对匿名通信系统的基本属性、分类方法和工作原理介绍的基础上,对其隐藏服务的定位技术按照用户位置的不同分为客户端定位和服务端定位分别进行了研究和阐述,重点介绍网络流水印技术、网站指纹攻击方法等代表性的隐藏服务定位技术,同时对现有隐藏服务定位技术的发展现状和优缺点进行总结,最后展望匿名通信系统及其隐藏服务定位技术的未来研究方向. 展开更多
关键词 匿名通信系统 隐藏服务 客户端定位 服务端定位
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部