搜索引擎

来自计算思维百科
跳转至: 导航搜索

搜索引擎(Search Engine)是大家经常使用的,所有搜索引擎可提炼成下载、索引和排序三种基本服务,也即自动下载尽可能多的网页、建立快速有效地索引、根据相关性对网页进行公平准确的排序。

搜索引擎(search engine )是一种帮助用户在Web上检索信息的工具。搜索引擎其实也是一个Web服务器,其主要功能是搜集Web上的各种资源并按一定规律进行分类,提供给用户进行检索。当用户要查找某类信息而又不知道具体网址时,就可求助于搜索引擎。例如很多人都访问过“新浪”、“搜弧”、“Yahoo”等网站,它们都是搜索引擎。

搜索引擎由三部分组成,一个负责收集信息的程序,一个索引数据库和一个面向用户的检索界面。收集信息的程序被称作Robot(机器人)、Wanderer(流浪者)、Crawler(爬行者)、Spider(蜘蛛)等,它们的任务是自动访问Internet上的 Web、FTP、Gopher等站点中的资源,进行信息索引并建立数据库。面向用户的检索界面通常就是搜索引擎的主页,它接受用户的检索请求,从索引数据库中检索,并将结果返回给用户。

如何自动下载互联网所有网页?完成这个功能的程序叫网络爬虫(Web Crawlers),在一些文献中也称机器人,它使用了图论中的遍历算法。