. .. .word.zl.搜索引擎的分类及工作原理XX:XXX 班级 :XXX 摘要:这篇论文是关于搜索引擎的分类及原理的分析。在浩瀚的网络资源中,搜索引擎〔 Search Engine〕是一种网上信息检索工具,它能帮助用户迅速而全面地找到所需要的信息。 它是一个集中了千千万万个站点的地方,主要功能是给人们搜索这些站点。它还会分门别类的把一些好的站点列出来,以方便人们查找资料,有了搜索引擎你就能很容易的找到你想要的内容或站点,因此掌握好使用搜索引擎对于任何上网的用户至关重要。一个好的搜索引擎,不仅数据库容量要大,更新频率、检索速度要快,支持对多语言的搜索,而且随着数据库容量的不断膨胀,还要能从庞大的资料库中准确地找到正确的资料。关键词: 搜索引擎工作原理分类蜘蛛搜集1.前言获得网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。真正意义上的搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词〔即关键词〕进展索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进展排序后,这些结果将按照与搜索关键词的相关度上下,依次排列。2.搜索引擎分类. .. .word.zl.搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎〔Full Text Search Engine〕、目录索引类搜索引擎〔 Search Index/Directory〕和元搜索引擎〔 Meta Search Engine〕。2.1 全文搜索引擎全文搜索引擎是从提取信息建立网页数据库。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间搜索引擎主动派出“蜘蛛〞程序,对一定 IP 地址 X 围内的互联进展检索,一旦发现新的, 它会自动提取的信息和网址参加自己的数据库。另一种是提交搜索,即拥有者主动向搜索引擎提交网址,它在一定时间内〔 2 天到数月不等〕定向向你的派出“蜘蛛〞程序,扫描你的并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规那么发生了很大变化,主动提交网址并不保证你的能进入搜索引擎数据库,因此目前最好的方法是多获得一些外部,让搜索引擎有更多时机找到你并自动将你的收录。当用户以关键词查找信息时,搜索引擎会在数据库中进展搜寻,如果找到与用户要求内容相符的,便采用特殊的算法——通常根据网...