W eb信息自动标引系统或搜索引擎的索引库的建立大多采用加权词频统计法,但引源的权值较难确定。为得出科学的加权方案,从标引词应反映文档主题内容这一原则出发,对标引源的权值设置提出了一种改进方案,基于遗传算法对W eb信息自动标引...W eb信息自动标引系统或搜索引擎的索引库的建立大多采用加权词频统计法,但引源的权值较难确定。为得出科学的加权方案,从标引词应反映文档主题内容这一原则出发,对标引源的权值设置提出了一种改进方案,基于遗传算法对W eb信息自动标引。此方案可以使标引源的权值设置根据标引内容动态调整,有效地提高标引源权值设置的合理性、准确性,自动标引结果的人机相符率可达到87.9%,具有较强的实用性。展开更多