相关性是指
搜索词和页面的相关程度。仅仅通过链接、字体、位置等表面特征,不能真正判断
搜索词和文章的相关性,更何况许多时候这些特征不会都同时存在。这也是许多对
搜索引擎做弊方法能有效的原因。另外,有些文章中没有出现
搜索词,但说的就是和搜索词十分相关的内容,例如搜索“恐怖分子”,但有网页是介绍本拉登的一些破坏行动,文中没有出现“恐怖分子”的子眼,
搜索引擎就无法搜索到该网页。表面特征只能治标,不能治本。治本的方法应该是增加语意理解,例如主题词和关键词的提取,从语意上分析,得出
搜索词和网页的相关程度,分析的越准,效果就会越好。