基于概念扩充的中文文本过滤模型被引量：7

Concept Expansion and Chinese Text Filtering Model

下载PDF

导出

摘要 1 前言今天,以因特网为主体的信息高速公路仍在不断普及和发展,因特网上蕴涵的海量信息远远超过人们的想象,面对这样的信息汪洋大海,人们往往感到束手无策,无所适从,出现所谓的“信息过载”问题。如何帮助人们有效地选择和利用所感兴趣的信息,同时保证人们在信息选择方面的个人隐私权利?这已成为学术界和企业界所十分关注的焦点。因此。 The background and the future of text filtering are described in this paper,and a concept-based Chinese text filtering model is presented. The main idea of the model is shown as follows:Original keywords are given by users,then the concept expansion is automatically performed with the keywords to construct the user profiles. It is noted that user profiles consist of the subprofiles,and the ratio of sub-profiles matching and the similarity of sub-profiles are defined. As a result, they can weaken the Boolean constrains to ensure that the text can be matched while some sub-profiles don't match with it , and they can restrict the Vector Space Model to match more subprofiles. In addition,the mechanism of passage matching is applied to improve the efficiency of filtering model.

作者林鸿飞战学刚姚天顺

机构地区东北大学计算机科学研究所

出处《计算机科学》 CSCD 北大核心 2000年第2期88-90,82,共4页 Computer Science

基金国家自然科学基金编号:69675019 国家教委博士点基金

关键词中文文本文本过滤模型概念扩充信息过滤 Text filtering,Boolean constrains,Vector space model,Concept expansion,Passage match-ing, User profiles,Fuzzy logic

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1刘开瑛,薛翠芳,郑家恒,周晓强.中文文本中抽取特征信息的区域与技术[J].中文信息学报,1998,12(2):1-7. 被引量：45
2吴立德，大规模中文文本处理，1997年
3Yan T W，Proc of the 1995 USENIX Technical Conf，1995年
4姚天顺，自然语言理解，1995年
5Yan T W，Proc of the Third Intl Conf on Parallel and Distributed Information System，1994年，89页

二级参考文献3

1靳从,樊春丽,杨静宇.主题词自动标引中的知识处理方法[J].情报理论与实践,1996,19(2):30-33. 被引量：3
2刘开瑛，计算机期刊关键词标引统计分析技术报告，1996年
3刘开瑛，中国人民银行××省分行《重要文件汇编》的主题词标引研究技术报告，1996年

共引文献44

1谢春发.中文信息处理在智能答疑系统中的应用研究[J].福建广播电视大学学报,2005(2):55-57.
2刘海峰,王元元,王倩.基于位置和类别结合模式的一种文本自动分类模型[J].图书情报工作,2006,50(S2):90-92.
3何静,刘海燕.基于向量空间模型的实时内容过滤[J].计算机工程,2004,30(15):26-27. 被引量：2
4郑海,林鸿飞.基于段落匹配的文本分类机制[J].计算机工程与应用,2004,40(28):174-176. 被引量：3
5温有奎.基于“知识元”的知识组织与检索[J].计算机工程与应用,2005,41(1):55-57. 被引量：74
6周钦强,孙炳达,王义.文本自动分类系统文本预处理方法的研究[J].计算机应用研究,2005,22(2):85-86. 被引量：15
7包剑,冀常鹏,李义杰.基于矢量空间模型的文本自动分类系统研究[J].计算机系统应用,2005,14(3):47-49. 被引量：6
8侯汉清 ,章成志 ,郑红 .Web概念挖掘中标引源加权方案初探[J].情报学报,2005,24(1):87-92. 被引量：32
9马文斌,王庆.Web内容过滤实现方法的研究[J].计算机工程,2004,30(B12):588-589. 被引量：4
10唐晓文.基于本体论的文本特征提取[J].电脑与信息技术,2005,13(1):36-38. 被引量：11

同被引文献25

1宋媛媛,孙坦.由信息过滤引发的基于知识的过滤机制构想[J].图书情报工作,2005,49(3):39-41. 被引量：4
2苏云,马慧芳.基于Web的信息过滤技术[J].情报杂志,2005,24(5):72-73. 被引量：12
3吴立德，大规模中文文本处理，1997年
4姚天顺.自然语言理解[M].北京：清华大学出版社,2002.81.
5H.P.Luhn.A business intelligence system[J].IBM Journal of Research and Development,1958,2 (4):314-319.
6Edward M.Housman.Survey of current systems for selective dissemination of information[R].Technical Report SIG/SDI-1,American Society for Information Science Special Interset Group on SDI,Washington DC,June 1969.
7Peter J.Denning.Electronic junk[J].Communications of the ACM,1982,25(3):163-165.
8Thomas W.Malone,Kenneth R.Grant,Franklyn A.Turbak etal.Intelligent information sharing systems[J].Communications of the ACM,1987:390-402.
9Belkin N.J.and Croft WB.Information Filtering and information Retrieval:Two Sides of the same coin?[J].Communication of ACM,1992,35(12):29-38.
10Yang Y,Chute Cq.An Example-based Mapping Method[J].In ACM Transation on Information Systems,1994,(7).

引证文献7

1明均仁,张帆.网络文本信息过滤的意义及其模型初探[J].图书与情报,2007(4):37-42. 被引量：4
2林鸿飞,杨志豪,赵晶.中文文本的信息自动抽取和相似检索机制[J].小型微型计算机系统,2007,28(11):2074-2079. 被引量：3
3郝海涛.基于向量机的文本分类中词典结构研究[J].福建电脑,2009,25(3):83-84.
4林鸿飞.基于混合模式的文本过滤模型[J].计算机研究与发展,2001,38(9):1127-1131. 被引量：22
5林鸿飞,王剑峰.基于合作模式的文本过滤模型[J].小型微型计算机系统,2001,22(11):1372-1374. 被引量：4
6林鸿飞.基于Web的信息过滤机制[J].计算机工程与应用,2002,38(2):190-192. 被引量：14
7林鸿飞,马雅彬.基于聚类的文本过滤模型[J].大连理工大学学报,2002,42(2):249-252. 被引量：9

二级引证文献52

1赵林,胡恬,黄萱菁,吴立德.基于知网的概念特征抽取方法[J].通信学报,2004,25(7):46-54. 被引量：17
2王楠.基于聚类的全文检索系统后处理[J].情报杂志,2005,24(1):112-114. 被引量：4
3王太雷.基于相似模式聚类的电子商务网站个性化推荐系统研究[J].计算机工程与应用,2005,41(6):152-157. 被引量：6
4王太雷.个性化推荐系统中相似模式聚类研究[J].计算机工程,2005,31(10):156-158. 被引量：3
5黄东平,田芳.BBS信息过滤技术研究[J].长江大学学报（自然科学版）,2004,1(1):16-18. 被引量：4
6张玉叶,李连,王春歆.个性化主动信息服务实现研究[J].情报杂志,2005,24(8):71-72. 被引量：2
7张全力,何卫平,秦忠宝,王政.基于样本公共特征的产品设计信息搜集[J].计算机工程,2006,32(3):209-211. 被引量：1
8陈江兵,张巍.基于状态转换方法的不良信息文本过滤模型[J].江西教育学院学报,2005,26(6):22-24.
9刘远超,王晓龙,刘秉权.一种改进的k-means文档聚类初值选择算法[J].高技术通讯,2006,16(1):11-15. 被引量：23
10潘红艳,林鸿飞,赵晶.基于矩阵划分和兴趣方差的协同过滤算法[J].情报学报,2006,25(1):49-54. 被引量：16

1尤文建,李绍滋,李堂秋.基于概念扩充的文本过滤模型[J].计算机工程与应用,2003,39(25):74-77. 被引量：9
2尤文建,李绍滋,李堂秋.基于词汇链的文本过滤模型[J].计算机应用研究,2003,20(9):32-35. 被引量：9
3陈沈焰,吴军华.基于本体的概念语义相似度计算及其应用[J].微电子学与计算机,2008,25(12):96-99. 被引量：31
4孟凡荣,田恬,张磊.基于语义树的语义关联度算法改进[J].微计算机信息,2009,25(12):268-270. 被引量：2
5陈江兵,张巍.基于状态转换方法的不良信息文本过滤模型[J].江西教育学院学报,2005,26(6):22-24.
6谢文玲,潘建国.基于语义相似度的个性化信息检索方法[J].计算机应用与软件,2011,28(5):161-164. 被引量：4
7赵丰年,刘林,商建云.基于概念的文本过滤模型[J].计算机工程与应用,2006,42(4):186-188. 被引量：11
8李嘉俊,郑宇,吴耿锋.基于领域本体的文本过滤模型[J].计算机工程与设计,2008,29(21):5555-5558. 被引量：4
9林鸿飞,姚天顺.基于示例的中文文本过滤模型[J].大连理工大学学报,2000,40(3):375-378. 被引量：13
10谷文,王迪,王红梅.基于概念扩充的新闻信息抽取模型[J].计算机与信息技术,2009(12):47-49.

计算机科学

2000年第2期

浏览历史

内容加载中请稍等...

基于概念扩充的中文文本过滤模型被引量：7

参考文献5

二级参考文献3

共引文献44

同被引文献25

引证文献7

二级引证文献52

相关作者

相关机构

相关主题

浏览历史

基于概念扩充的中文文本过滤模型 被引量：7

参考文献5

二级参考文献3

共引文献44

同被引文献25

引证文献7

二级引证文献52

相关作者

相关机构

相关主题

浏览历史

基于概念扩充的中文文本过滤模型被引量：7