目前主流开源爬虫框架在分析页面与主题领域关联性上,常采用基于关键词的量化和向量空间模型算法相融合,但融合疏忽了界面语义与特定主题间的关联,导致爬取内容与主题产生偏差。为了给金融等领域的舆情分析提供准确的数据支撑,提出一种...目前主流开源爬虫框架在分析页面与主题领域关联性上,常采用基于关键词的量化和向量空间模型算法相融合,但融合疏忽了界面语义与特定主题间的关联,导致爬取内容与主题产生偏差。为了给金融等领域的舆情分析提供准确的数据支撑,提出一种面向领域扩展主题库的爬虫及系统,通过扩展主题特征库,融合向量空间模型(Vector Space Model,VSM)与超链接主题搜索算法(Hyperlink-Induced Topic Search,HITS),优化了主题页面相关度计算,并针对股票舆情信息爬取进行仿真。结果表明,上述扩展主题型爬虫在爬取准确率和效率等方面有较好地提升,能够有效地完成领域主题信息的爬取任务。展开更多
嵌入效率高和隐藏信息量大的信息隐藏算法,已成为信息安全领域研究的一个热点。通过对该类信息隐藏算法的分析,提出了一种高效率的随机分块信息隐藏算法ERS(an Efficient high payload and Ran-domly selected sub-blocks image Stegano...嵌入效率高和隐藏信息量大的信息隐藏算法,已成为信息安全领域研究的一个热点。通过对该类信息隐藏算法的分析,提出了一种高效率的随机分块信息隐藏算法ERS(an Efficient high payload and Ran-domly selected sub-blocks image Steganography)。实验与分析结果表明:该算法不仅能够减小对载体的修改,提高嵌入效率,而且其算法实现简单、计算量小,性能优于其他算法。展开更多
针对目前双重压缩研究的问题,提出一种确定初始矩阵的新方法(a method of calculating primary quanti-zation matrix of JPEG,简称CM)。在未知双重压缩系数大小关系的条件下,CM方法通过剪切JPEG图像的方式获得与原始图像近似的特性,然...针对目前双重压缩研究的问题,提出一种确定初始矩阵的新方法(a method of calculating primary quanti-zation matrix of JPEG,简称CM)。在未知双重压缩系数大小关系的条件下,CM方法通过剪切JPEG图像的方式获得与原始图像近似的特性,然后再通过对这些特性进行分析来确定初始量化矩阵。实验结果表明,CM方法能够确定初始量化矩阵,它是一种非常有效的方法。展开更多
通过对SPA方法和SIHA算法的分析,提出了一种扩展结构化的LSB信息隐藏算法(an extened struc-tured steganography based on adjacency pixel,ESSA)。通过分析图像相邻像素结构体,找到相似的相邻像素结构体,根据这些相邻像素结构体的统...通过对SPA方法和SIHA算法的分析,提出了一种扩展结构化的LSB信息隐藏算法(an extened struc-tured steganography based on adjacency pixel,ESSA)。通过分析图像相邻像素结构体,找到相似的相邻像素结构体,根据这些相邻像素结构体的统计性质变化来隐藏信息。实验证明:该算法不仅能够有效的抵抗SPA统计分析方法,而且实现简单、计算量小,隐藏优于其他算法。展开更多
文摘目前主流开源爬虫框架在分析页面与主题领域关联性上,常采用基于关键词的量化和向量空间模型算法相融合,但融合疏忽了界面语义与特定主题间的关联,导致爬取内容与主题产生偏差。为了给金融等领域的舆情分析提供准确的数据支撑,提出一种面向领域扩展主题库的爬虫及系统,通过扩展主题特征库,融合向量空间模型(Vector Space Model,VSM)与超链接主题搜索算法(Hyperlink-Induced Topic Search,HITS),优化了主题页面相关度计算,并针对股票舆情信息爬取进行仿真。结果表明,上述扩展主题型爬虫在爬取准确率和效率等方面有较好地提升,能够有效地完成领域主题信息的爬取任务。
文摘嵌入效率高和隐藏信息量大的信息隐藏算法,已成为信息安全领域研究的一个热点。通过对该类信息隐藏算法的分析,提出了一种高效率的随机分块信息隐藏算法ERS(an Efficient high payload and Ran-domly selected sub-blocks image Steganography)。实验与分析结果表明:该算法不仅能够减小对载体的修改,提高嵌入效率,而且其算法实现简单、计算量小,性能优于其他算法。
文摘针对目前双重压缩研究的问题,提出一种确定初始矩阵的新方法(a method of calculating primary quanti-zation matrix of JPEG,简称CM)。在未知双重压缩系数大小关系的条件下,CM方法通过剪切JPEG图像的方式获得与原始图像近似的特性,然后再通过对这些特性进行分析来确定初始量化矩阵。实验结果表明,CM方法能够确定初始量化矩阵,它是一种非常有效的方法。
文摘通过对SPA方法和SIHA算法的分析,提出了一种扩展结构化的LSB信息隐藏算法(an extened struc-tured steganography based on adjacency pixel,ESSA)。通过分析图像相邻像素结构体,找到相似的相邻像素结构体,根据这些相邻像素结构体的统计性质变化来隐藏信息。实验证明:该算法不仅能够有效的抵抗SPA统计分析方法,而且实现简单、计算量小,隐藏优于其他算法。