基于层次概念的用户兴趣模型研究被引量：6

Study of user profile technology based on hierarchy

下载PDF

导出

摘要使用基于关键词匹配的方法,分析了HTML语言描述的Web文档,提取网页中有用的特征信息,得到两类标记中的内容:一类是网页的全局描述信息,如<TITLE></TITLE>和<META></META>;另一类起局部修饰作用,强调了网页的部分内容,如<Hn>。从而提出了基于层次概念的用户模型,并使用向量空间模型方法建立了以突发事件新闻为基础的用户兴趣模型。实验表明,这种方法有一定的可行性。 Web documents described by HTML language is analyzed by using the method about matches based on the key word, which the useful characteristic information of web documents. Thus two kinds marks contents is obtained： One is overall description information about web documents like 〈TITLE〉〈/TITLE〉and 〈META〉〈/META〉. Another played embellishment in web documents, emphasized partial contents more or less, like 〈Hn〉.thus proposed based on the hierarchy concept user model. Then, based web accidental news corpora, user interest model is established by vector space model. The experiment indicated that, the method has the certain feasibility.

作者张彦张永奎安增波王鹏

机构地区山西大学计算机与信息技术学院中国人民解放军

出处《计算机工程与设计》 CSCD 北大核心 2008年第1期181-183,共3页 Computer Engineering and Design

基金国家自然科学基金项目(60475022) 山西省自然科学基金项目(20041041) 山西省回国留学人员基金项目(2002004)

关键词层次分析用户模型个性化服务 Web突发事件新闻中文信息处理 analytic hierarchy user model personalization service web accidental news Chinese information processing

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1黄萱菁,夏迎炬,吴立德.基于向量空间模型的文本过滤系统[J].软件学报,2003,14(3):435-442. 被引量：92
2李业丽,林鸿飞,姚天顺.基于示例的用户信息需求模型的获取和表示[J].计算机工程与应用,2000,36(9):11-12. 被引量：14
3阮彤,冯东雷,李京.基于贝叶斯网络的信息过滤模型研究[J].计算机研究与发展,2002,39(12):1564-1571. 被引量：10
4张永奎.基于分类模板的用户模型构造方法[J].山西大学学报（自然科学版）,2002,25(2):109-111. 被引量：11
5[6]W3C.Document object model (DOM) level 2 core specification[EB/OL].http://www.w3.org,2000.
6俞士汶,段慧明,朱学锋,孙斌.北京大学现代汉语语料库基本加工规范[J].中文信息学报,2002,16(5):49-64. 被引量：126
7刘里,何中市.基于关键词语的文本特征选择及权重计算方案[J].计算机工程与设计,2006,27(6):934-936. 被引量：12

二级参考文献35

1吴军,王作英,禹锋,王侠.汉语语料的自动分类[J].中文信息学报,1995,9(4):25-32. 被引量：24
2李晓黎史忠植等.搜索引擎实现个性化服务研究.人工智能进展[M].北京:清华大学出版社,2001..
3张永奎郭文宏等.网上中文信息过滤技术的研究.第一届中文信息处理发展国际研讨会[M].上海,2001..
4[1]Nicholas J Belkin, W Bruce Croft. Information filtering and information retrieval: Two sides of the same coin? Communications of ACM, 1992, 35(12): 29～38
5[2]Tak W Yan, Hector Garcia-Molina. SIFT-A tool for wide-area information dissemination. In: Proc of the 1995 USENIX Technical Conf. 1995. 177～186
6[3]J Mostafa et al. A multilevel approach to intelligent information filtering: Model, system, and evaluation. ACM Trans on Information Systems, 1997, 15(4): 368～399
7[4]Demet Aksoy et al. Research in data broadcast and dissemination. In: InfoComm '98. 1998
8[5]David Heckman. A tutorial on learning with Bayesian networks. Tech Rep: MSR-TR-95-06,1995
9[6]Gammerman. Probabilistic Reasoning and Bayesian Networks. Alfred Waller Limited Publisher, 1995
10[7]Fabio Crestani, Mounia Lalmas et al. "Is this document relevant?… probably": A survey of probabilistic models in information retrieval. ACM Computing Surveys, 1998, 30(4): 529～551

共引文献254

1杨丽姣,肖航,刘智颖.《信息处理用现代汉语词类标记规范》修订研究[J].语言文字应用,2021(3):111-120. 被引量：1
2吴先,胡俊峰.基于历时语料库的在线词典编纂系统设计[J].中文信息学报,2020(5):27-35. 被引量：1
3程勇,徐德宽,董军.基于多元语言特征与深度特征融合的中文文本阅读难度自动分级研究[J].中文信息学报,2020(4):101-110. 被引量：11
4谭晓平.现代汉语文本语料库建设及应用现状研究[J].对外汉语研究,2018,0(1):20-29.
5姚露露,李云岭,宋凯丽.中文地名地址标注方法研究[J].测绘地理信息,2021,46(S01):182-184. 被引量：1
6化振红.建立中古汉语语料库分词规范的若干问题[J].语言研究集刊,2021(2):151-167. 被引量：2
7董宝力,祁国宁,顾新建.基于混合向量空间模型的主题网站识别[J].清华大学学报（自然科学版）,2005,45(S1):1795-1801. 被引量：4
8刘亮.现代汉语广义助词知识库构建与应用[J].光盘技术,2008(4):14-16. 被引量：2
9孔颖,裘彬强,徐从富.基于CART算法的垃圾邮件过滤模型设计与实现[J].计算机应用,2009,29(2):374-376. 被引量：4
10杨芸,周昌乐,王雪梅,戴帅湘.基于机器理解的汉语隐喻分类研究初步[J].中文信息学报,2004,18(4):31-36. 被引量：15

同被引文献57

1徐斌,刘赛,康立山,郑刚.基于遗传算法的信息检索技术[J].计算机工程,2004,30(9):74-75. 被引量：14
2余力,刘鲁.电子商务个性化推荐研究[J].计算机集成制造系统,2004,10(10):1306-1313. 被引量：104
3林鸿飞,杨元生.用户兴趣模型的表示和更新机制[J].计算机研究与发展,2002,39(7):843-847. 被引量：23
4陈炯,张永奎.一种基于词聚类的中文文本主题抽取方法[J].计算机应用,2005,25(4):754-756. 被引量：17
5赵银春,付关友,朱征宇.基于Web浏览内容和行为相结合的用户兴趣挖掘[J].计算机工程,2005,31(12):93-94. 被引量：36
6王开选,张永奎.信息过滤中用户模型的表示方法[J].计算机工程,2006,32(5):205-206. 被引量：3
7徐科,崔志明.基于搜索历史的用户兴趣模型的研究[J].计算机技术与发展,2006,16(5):18-20. 被引量：11
8王秀丽,罗方芳,宁正元.基于模糊角分类的神经网络用户兴趣模型分类算法[J].计算机应用,2006,26(10):2437-2439. 被引量：4
9罗永莲,张永奎.基于发布时间的新闻网页去重方法研究[J].计算机工程与应用,2007,43(6):119-121. 被引量：3
10张玉连,王权.基于浏览行为和浏览内容的用户兴趣建模[J].现代图书情报技术,2007(6):52-55. 被引量：24

引证文献6

1聂立,钟珞.主动服务中程序挖掘系统框架的设计与实现[J].计算机应用,2009,29(7):1767-1770.
2张永奎,张晴,王磊.面向信息处理的突发事件新闻语料库建设与应用研究[J].山西大学学报（自然科学版）,2009,32(4):546-551. 被引量：8
3南智敏,钱松荣.引入漂移特性的用户兴趣模型优化研究[J].微型电脑应用,2012,28(3):30-32. 被引量：2
4南智敏,钱松荣.网页兴趣度度量方法及其在兴趣模型中的应用研究[J].微型电脑应用,2012,28(6):29-31.
5谢梓琪,谢颖华.一种基于数据挖掘的SNS用户兴趣模型[J].计算机与现代化,2014(2):24-27. 被引量：2
6汤鹏,吴国栋,许瑞瑞.用户偏好模型构建研究[J].石家庄学院学报,2014,16(6):31-35. 被引量：1

二级引证文献13

1钟丹,朱倩,李梅,程显毅.人称名词短语单复数信息和最大熵模型的指代消解[J].江南大学学报（自然科学版）,2009,8(6):666-669. 被引量：1
2田芬.英汉语经济类硬新闻的裁决系统对比研究[J].山东外语教学,2011,32(2):32-36. 被引量：3
3宋云霞,张大伟,孙卓,韦军.以语料库为载体的实践教学模式研究[J].实验技术与管理,2011,28(9):110-113. 被引量：3
4韩永峰,郭志刚,陈翰,许旭阳.基于领域特征词的突发事件层次分类方法[J].信息工程大学学报,2012,13(5):593-600. 被引量：3
5郭平,刘波,沈岳.农业云大数据自组织推送关键技术综述[J].软件,2013,34(3):1-6. 被引量：24
6孙玲芳,王成文,徐会.基于语义Web的关系型虚拟社区服务发现模型分析[J].华东交通大学学报,2014,31(2):105-111. 被引量：1
7张钰莎,蒋盛益.微博公共事件演化分析研究综述[J].广东工业大学学报,2015,32(2):58-63. 被引量：1
8宋天勇,赵辉,郑山红,王国春.基于查询-概念的用户兴趣模型构建[J].吉林大学学报（信息科学版）,2015,33(3):310-314.
9任子亭,罗兰花,廖荣升.移动社会网络中基于位置的个性化餐馆推荐建模研究[J].无线互联科技,2016,13(14):137-139. 被引量：1
10张春菊,张雪英,王曙,廖建平,陈晓丹.中文文本的事件时空信息标注[J].中文信息学报,2016,30(3):213-222. 被引量：12

1李忠慧.基于Z的适配器模式形式化描述[J].福建电脑,2008,24(7):80-80.
2王小林,陆骆勇,邰伟鹏.基于信息熵的新的词语相似度算法研究[J].计算机技术与发展,2015,25(9):119-122. 被引量：3
3段立娟,高文,马继勇.Rich GetRicher——图像检索中的一种自适应的相关反馈方法[J].计算机研究与发展,2001,38(8):960-965. 被引量：3
4许方芳,郑诚,戈明东.语义网中的本体映射研究[J].计算机与现代化,2008(2):36-39. 被引量：2
5夏华林,张仰森.基于规则与统计的Web突发事件新闻多层次分类[J].计算机应用,2012,32(2):392-394. 被引量：8
6陈炯,张永奎.一种基于文档差异度的Web突发事件新闻个性化推荐算法[J].计算机应用与软件,2010,27(11):43-46.
7罗成,柏彦奇.基于复杂系统层次的分辨率识别[J].科学技术与工程,2006,6(6):771-774. 被引量：1
8韩柯,李德毅.数据库中弱数据模式的发现[J].计算机研究与发展,1997,34(S1):317-321.
9李敏强,寇纪淞.基于数据库的层次概念知识体系的一种获取方法[J].控制与决策,1999,14(A11):541-544. 被引量：3
10罗永莲,罗永秀,张永奎.突发事件新闻网页的去重方法研究[J].计算机应用与软件,2008,25(8):24-26. 被引量：4

计算机工程与设计

2008年第1期

浏览历史

内容加载中请稍等...

基于层次概念的用户兴趣模型研究被引量：6

参考文献7

二级参考文献35

共引文献254

同被引文献57

引证文献6

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于层次概念的用户兴趣模型研究 被引量：6

参考文献7

二级参考文献35

共引文献254

同被引文献57

引证文献6

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

基于层次概念的用户兴趣模型研究被引量：6