摘要
文本过滤旨在帮助用户处理自己感兴趣的文本 .提出了基于混合模式的文本过滤模型 .其基本思想是将基于内容的过滤方法和合作过滤方法结合起来 ,给出了用户评注的权威性和一致性度量 ,以便更好地运用用户的评注信息 .在此基础上 ,结合用户的个人兴趣 ,给出了文本特征抽取机制、文本推荐机制、文本与信息需求模型的匹配机制 .该方法不依赖于具体的领域知识库 ,大大降低“噪音”影响 ,并可以适用于多媒体类型文件的过滤和信息服务 .
Text filtering plays an important role in processing readable online texts. A hybrid model for text filtering is presented in this paper. Its main idea is shown as follows: it integrates content-based filtering and collaborative filtering. On the basis of users' annotations, it provides users with the texts related to their interest. Also put forward are the approach for text feature extraction, the pattern of user annotations, and the mechanism for matching texts and profiles. As a result, the model is independent of concrete domain knowledge, and it improves the efficiency of text filtering.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2001年第9期1127-1131,共5页
Journal of Computer Research and Development
基金
国家自然科学基金重点项目资助 ( 6 978930 1)
关键词
文本过滤
内容过滤
文本特征抽取
用户模板
混合模式
知识库
信息处理
text filtering, content-based filtering, collaborative filtering, text feature extraction, user profile, user annotation