结构推理 简述信息检索的三种模型。
【正确答案】[答案(要点)]
   (1)信息检索模型
   当前应用最多的是布尔模型、向量空间模型和概率模型。
   1)布尔模型。布尔模型是最简单的信息检索模型。这种模型的理论基础是集合论。在布尔模型中,文档和查询都被表示为索引项的集合。用户可以根据检索项在文档中的布尔逻辑关系提交查询,检索系统根据事先建立的倒排文件结构,确定查询结果。为了克服布尔模型查询结果的无序性,可以规定按一定的优先次序来排列查询结果。
   布尔模型最大的优点是理论简单、使用方便。但它只能给出精确匹配的结果,因此,检索结果有可能因查询词在大量文档中出现而数量太多,或者由于找不到与查询词完全匹配的文档而使结果太少。
   2)向量空间模型。向量空间模型由Salton等人于20世纪60年代末提出,是一种简便、高效的文本表示模型,其理论基础是代数学。向量空间模型把用户的查询要求和数据库文档信息表示成由检索项构成的向量空间中的点。而通过计算向量之间的距离来判定文档和查询之间的相似程度。然后,根据相似程度排列查询结果。向量空间模型的关键在于特征向量的选取和特征向量的权值计算两个部分。
   向量空间模型最主要的优点在于:该模型的权重计算方法能够提高系统的检索性能;模型中使用的部分匹配方法能检索出与用户的查询输入条件“近似”的文档;在模型中可以根据检索出的结果与查询条件的相关程度对结果进行排序。另外,向量空间模型计算简单,检索速度快。
   向量空间模型也有缺点。在该模型中有一个假定:所有的索引项之间是相互独立的。在权重计算公式中就没有考虑索引项之间的相互关系。
   3)概率模型。在信息检索系统中,所需要查询的信息既不能被精确地表示,也没有一个清晰的过程来判别一个数据对象是否就是所需要的。概率模型就是处理这种不确定性最成功的方法。目前已经提出了很多不同的概率检索模型,但所有的概率模型都存在着参数估计、查询扩展和文档、查询的表示等一般性的问题。
【答案解析】