摘要
针对当前过滤方法过滤不良信息的缺陷和不足,建立并采用三重网页过滤模型,将健康信息推荐给用户,将带有不良信息的网页过滤掉。第一层过滤采用基于关键词匹配的方法,快速识别出健康网页,推荐给用户;第二层采用基于贝叶斯的过滤方法,将第一层不能匹配的网页进行二次过滤,快速淘汰分类特征明显的网页;第三层采用SVM方法将第二层不能识别的网页进行再次过滤。该模型能合理利用上述三种方法的优缺点,发挥各自优势,提高网页过滤的准确率和正确率。
出处
《软件导刊》
2014年第11期25-27,共3页
Software Guide
基金
山东协和学院校级科技项目(XHXY201417)