基于扩展的带路径约束随机游走模型的扩展词排序方法

Sorting Expansion Terms by Extended Path-constrained Random Walks Model

下载PDF

导出

摘要在同时从点击文档与历史查询条件等多个扩展词来源选取扩展词的过程中,扩展词来源对应的约束值可以影响该来源的扩展词被优先选择的程度.由于现有模型为不同查询条件的相同扩展词来源设置相同的约束值,因此导致所有查询条件优先选择的扩展词来源相同.然而观察日志可以发现,不同查询条件适合从不同扩展词来源选取扩展词.由此,提出一种扩展的带路径约束的随机游走模型.该模型首先对每个查询条件与不同来源扩展词的相关性进行统一尺度的估计,并根据估计结果对不同扩展词来源对应的约束值进行估计,从而使不同的查询条件能够优先选择不同来源的扩展词.一系列实验表明,本文方法构造的扩展查询条件具有更好的性能,更符合用户的查询目标. When selecting expansion terms from both clicked documents and queries in log, path consistent has the influence to the prior choice of expansion terms in each resource. Because current model assigns the same expansion term resource of different queries by the same path consistent value, all queries may prior select the same expansion term resource. However, it can be observed from log that different queries are suitable for selecting expansion terms from different expansion term resources. Therefore, this paper proposed an expanded Path-Constrained Random Walks model. The model firstly evaluates relevance between the query and expansion terms from different resources by a unified judgment,and assigns different expansion term resources of one query with different path consistent values. That allows different queries can prior select different resources of expansion term by their own condition. Experiment results show that performance of expansion query generated by this paper is better and more related to current user intent.

作者张博张斌郭鹏伟孙达明

机构地区东北大学信息科学与工程学院沈阳大学信息工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2017年第2期254-258,共5页 Journal of Chinese Computer Systems

基金国家科技支撑计划项目(2014BAI17B00)资助宁夏回族自治区自然科学基金项目(NZ13265)资助中央高校东北大学基本科研专项基金项目(N120804001 N120204003)资助

关键词查询扩展日志挖掘扩展词排序随机游走 query expansion log mining expansion term sorting random walk

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1付博,赵世奇,刘挺.Web查询日志研究综述[J].电子学报,2013,41(9):1800-1808. 被引量：8
2伍大勇,赵世奇,刘挺,张宇.融合多类特征的Web查询意图识别[J].模式识别与人工智能,2012,25(3):500-505. 被引量：11
3职为梅,郭华平,张婷,范明.一种新的面向非平衡分类问题的特征变换方法[J].小型微型计算机系统,2015,36(5):1037-1041. 被引量：1

二级参考文献65

1Cui H, WenJR, NieJY, Ma WY. Query expansion by mining user 10gs[J] . IEEE Transaction on Knowledge and Data Engi?neering,2003, 15( 4) : 829 - 839.
2Fonseca BM. Concept-based interactive query expansion[AJ. Proceeding of the CIKM[CJ . New York: ACM Press, 2005 . 696 -703.
3Baeza-Yates, Hurtado C, Mendoza M. Query recommendation using query logs in search engines[AJ . Proceeding of the EDBT Workshop[CJ. Berlin, Heidelberg: Springer-Verlag, 2004 . 588 - 596.
4Cao HH,Jiang DX,PeiJ,He Q,Liao Z,Chen EH,Li H.Con?text-aware query suggestion by mining click-through and ses?sion data[AJ . Proceeding of the KDD[CJ . New York: ACM Press, 2008 . 875 - 883 .
5Huang C, et al. Relevant term suggestion in interactive web search based on contextual information in query session logs[J] .Jouma1 of the American Society for Information Science and Technology, 2003 . 54( 7) : 638 - 649.
6Zhao SQ, Wang HF, Liu T. Paraphrasing with search engine query 10gs[AJ. Proceeding of the COLING[CJ. Morristown: ACL,2010.1317 - 1325.
7Pasca M. Weakly-supervised discovery of named entities using web search queries[AJ . Proceeding of the CIKM[CJ . New York:ACM Press, 2007 .683 - 690.
8GuoJF, Xu G, Cheng XQ, Li H. 2009. Named entity recogni?tion in query[AJ . Proceeding of the SIGIR[CJ . New York: ACM Press, 2009.267 - 274.
9DuJ ,Zhang ZM, YanJ,Cui Y ,Cheng Z. Using search session context for named entity recognition in query[AJ . Proceeding of the SIGIR[c . New York:ACM Press, 2010. 765 -766.
10Jansen BJ,Spink A.How are we searching the World Wide Web? A comparison of nine search engine transaction logs[J] . Information Processing and Management, 2006, 42 ( 1 ) : 248 - 263.

共引文献16

1唐静笑,吕学强,柳成洋,李涵.用户查询意图的层次化识别方法[J].现代图书情报技术,2014(1):36-42. 被引量：1
2唐静笑,吕学强,柳成洋,李涵.搜索日志中领域查询串识别研究[J].计算机工程与设计,2014,35(5):1766-1771.
3张晓娟,陆伟,雷声伟.基于查询特征分析的新闻意图自动识别[J].图书情报工作,2014,58(20):82-90. 被引量：2
4刘峰,李煜,吕学强,李卓.查询主题分类方法研究[J].现代图书情报技术,2015(4):10-17. 被引量：4
5张晓娟,李健,乐兴虎.不同意图类别查询的搜索引擎稳定性分析[J].情报杂志,2015,34(6):183-190.
6田萱,张骁,孟祥光,陈志泊.时间敏感查询词补全关键技术研究综述[J].电子学报,2015,43(6):1160-1168.
7李煜,吕学强,李卓,徐丽萍.查询日志中查询意图的自动识别[J].计算机应用与软件,2015,32(11):27-31. 被引量：1
8孟奎,刘梦赤,胡婕.基于字符级循环网络的查询意图识别模型[J].计算机工程,2017,34(3):181-186. 被引量：4
9张晓娟.信息类、导航类与事务类查询的网络动态性分析[J].数据分析与知识发现,2017,1(4):9-19. 被引量：1
10张晓娟.信息类、导航类与事务类查询个性化潜力的对比析究[J].数字图书馆论坛,2017(9):35-41. 被引量：2

1吴小波,徐维祥.利用FP-树挖掘有约束的频繁模式[J].北京交通大学学报,2005,29(6):23-27.
2邱德红,潘昕昕,陈传波.基于多尺度序列谱核半定规划优化的签名认证方法[J].电子学报,2008,36(B12):44-49.
3张志纯,杨晓文,况立群,韩燮.基于Virtools和5DT数据手套的手势仿真研究[J].科学技术与工程,2015,35(4):140-144. 被引量：7
4谷瑞军,叶宾,须文波.一种改进的谱聚类算法[J].计算机研究与发展,2007,44(z2):145-149. 被引量：6
5王诚,赵振文.基于约束的粗糙集规则获取并行算法研究[J].南京邮电大学学报（自然科学版）,2016,36(2):82-89.
6王评,陈国龙.一种基于约束项的关联规则挖掘模型[J].福建电脑,2003,19(12):4-5.
7王傲胜,常英丽.利润约束的关联规则在故障检测中的应用[J].矿山机械,2007,35(11):117-119.
8蔡志平,殷建平,刘湘辉,刘芳,吕绍和.链路约束的分布式网络监测模型[J].计算机研究与发展,2006,43(4):601-606. 被引量：2
9赵会群,张诗侃,赵俊宝.本体解析的应用研究[J].计算机时代,2012(7):20-22. 被引量：3
10周冰,李聪,邓娟.PSO约束优化耦合直方图均衡化的图像增强算法[J].现代电子技术,2016,39(15):32-37. 被引量：5

小型微型计算机系统

2017年第2期

浏览历史

内容加载中请稍等...

基于扩展的带路径约束随机游走模型的扩展词排序方法

参考文献3

二级参考文献65

共引文献16

相关作者

相关机构

相关主题

浏览历史