所有
搜索引擎大全的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill W heelan发明的Archie(Archie FAQ)。
虽然当时
World Wide Web还未出现,但网络中
文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的
搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于
Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。
Jughead是后来另一个Gopher搜索工具。
第一类是基于
关键字搜索:利用对各个文件中特定数据项目的值进行搜索。主流的
搜索引擎有
百度、
Google、
雅虎、
搜狗、
msn、
有道等等。
第二类基于图像形式特征的抽取:由图像分析软件自动抽取图像的
颜色、形状、
纹理等特征,建立特征索引库,用户只需将要查找的图像的大致特征描述出来,就可以找出与之具有相近特征的图像。这是一种全新的
搜索引擎,目前国内有
安图搜、
百度识图等。
第三类属于
聚合搜索,即把多种
搜索引擎的搜索框合并为一个搜索框,这其中又包括对原搜索结果进行加工再处理的及不改变原搜索引擎结果两类。前一类在美国比较常见,如:Dogpile、 WebCrawler。这种
搜索引擎一般都会有如:“power by
google yahoo等字样”,后一类出现的时间较晚,还仅有
搜霸天下一家公司在做。
搜索大全的优点就是在一个
网页同时对各个
搜索引擎结果的罗列供用户直观比较,而缺点则是如果用户不用比较已经找到了想要的页面,它就额外浪费了不需要得到资源,并且额外的比较模块和广告模块也会占据页面空间,会对视觉效果造成影响。
不同
搜索引擎,由于非自然搜索引擎(有
竞价排名,网站可以通过付费来改变搜索结果排序)的商业特点、搜索引擎内部广告算法差异等因素造成与用户实际需要寻找的
网页并不一定都能够在结果靠前的位置找到,所以比较搜索引擎成为很多高端用户的习惯。而
搜索大全则替用户完成这一过程。
搜索大全,并不是罗列诸多
搜索引擎供人们使用,而是使用程序设计和
动态页面相结合,使用
框架页面和
脚本程序调用其他搜索引擎的结果,在同一个页面中完成对多个搜索引擎信息的检索。
由于资源可能会被额外的浪费,诸
搜索引擎并不十分欢迎
搜索大全的建立,所以这一模式是否可以有序发展下去,现在并不能下结论。到目前,国内并没有良好的已经成型可供用户使用的的
搜索大全。 同时所谓的
搜索大全也不过有以下几种可能,其一,将已有个
搜索引擎能够搜索到的信息简单累加;其二,对于已有个搜索引擎能够搜索到信息进行简单程式化处理之后,再呈现给搜索客户;其三,探索一种新型的思路进行超越搜索引擎的宽域搜索。