搜索引擎工作原理的三个过程(搜索引擎的工作原理(简单罗列要点))
本文目录:
搜索引擎工作原理的三个过程
最佳答案:
搜索引擎的工作原理包括爬行和抓取、建立索引、排序与展示三个过程。
爬行和抓取是搜索引擎工作的第一步,完成数据收集的任务。搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也称为机器人(bot)。搜索引擎通过网络爬虫程序(爬虫)从互联网上抓取网页内容,并将这些内容存储在数据库中。建立索引是搜索引擎工作的第二步,是对抓取来的页面数据进行文字提取、中文分词、索引等处理,以备排名程序调用。排序与展示是搜索引擎工作的第三步。当用户输入关键词进行检索时,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
搜索引擎是怎么工作的
搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定ip地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。 另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向你的网站派出“蜘蛛”程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。 当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。搜索引擎的工作原理(简单罗列要点)
网页搜索,大致是三个过程:首先查找信息,提取信息;接着是建库;分词,查询关键词,最后是返回需求结果。
Tags: 搜索引擎工作原理的三个过程