您的当前位置:易赛优化SEO公司->关键词优化->网站关键词优化->浏览文章
网站关键词优化公司WEBSITE KEYWORD
WEBSITE KEYWORD
WEBSITE KEYWORD
Web搜索引擎概述

  1 Web 搜索引擎的定义      搜索引擎优化(SEO)技术。来源于历史悠长的全文检索技术。从字面上可拆分为“搜”、“索”、“引擎”3个含义。“搜”就是大量信息的抓取百度网站排名,对抓取回来后的信息进行智能提取,排重、质量分析等处理。“索”就是大量处理后信息的存储、信息排序、快速查询。“引擎&rd......

Web搜索引擎概述

标签:搜索,搜索引擎,索引,引擎,概述 发布时间:2018年09月29日 浏览28

  1 Web 搜索引擎的定义      搜索引擎优化seo)技术。来源于历史悠长的全文检索技术。从字面上可拆分为“搜”、“索”、“引擎”3个含义。“搜”就是大量信息的抓取百度网站排名,对抓取回来后的信息进行智能提取,排重、质量分析等处理。“索”就是大量处理后信息的存储、信息排序、快速查询。“引擎”就是指体系不但能存储亿级的数据,而且还能有伟大的并发处理能力。这里所称的搜索引擎指的是一种在Web上应用的软件体系,它以肯定的策略在Web上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户查询的途径重要包括自由词全文检索、主题词检索、分类检索及其其他特别信息的检索。   Web搜索引擎概述   2 Web 搜索引擎的分类      Web搜索引擎按照检索体例可分为全文搜索引擎(Full Text Search Engine),分类目录(Direetory)搜索引擎和元搜索引擎(META Search Engine)三大类。      第一类,全文搜索引擎,又叫机器人搜索引擎,是通过一个叫网络机器人(Robot)或网络蜘蛛(Spider)的软件,主动分析网络上的各种链接并获取网页信息内容,按规则加以分折整顿,记人数据库。其比较典型的代表是Google、Baidu;全文搜索引擎体系的好处是全文搜索,检索功能强,信息更新速度快。瑕玷是信息太多、命中率低、重复链接较多、条理结构不清晰。      第二类,分类目录搜索引擎,是行使各网站向“搜索引擎”提交网站信息时填写的关键词和网站描述等资料,通过人工的体例收集整顿网站资料形成数据库,其典型代表有Yahoo (雅虎) Sohu(搜狐)、新浪、网易等网站的分类目录。好处是条理、结构清晰,易于查找;多级类目, 便于查询到详细明确的主题;内容提纲、分类目录下,有简明扼要的内容,用户可以根据目录有针对性地逐级查询信息;其瑕玷是必要人工介人、维护量大搜索范围较小、查全率较低,对偏僻主题新兴学科、交叉学科不能很好地涵盖,类目间的交叉会导致重复和资源虚耗。另外,因为数据库更新速度比较慢,站点自己的动态转变不能及时地反映到搜索效果中,紧张影响了查询效果的时效性。      第三类,元搜索引擎(META Search Engine),这类搜索引擎没有本身的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的效果进行重复排除、重新排序等处理后,作为本身的效果返回给用户,这类搜索引擎兼集多个搜索引擎的信息,并且加人新的排序和信息过滤,可以很好地进步用户写意度,它的代表是MetaCrawler .InfoMarket;该类搜索引擎的好处是能够在短时间内提供相对周全和正确的信息;瑕玷是不能够充分使用所使用的搜索引擎的功能,用户必要做更多的筛选。      此外,还有其他的分类体例,例如按查询体例可分为欣赏式搜索引擎、关键词搜索引擎、全文搜索引擎、智能搜索引擎;按语种又分为单语种搜索引擎、多语种搜索引擎和跨语言搜索引擎等。分析索引体系程序对下载的网页进行预处理辽宁人事考试网首页,提取网页的主题以及和主题相干的内容(包括网页所在URL、编码类型、页面内容包含的关键词、择要、正文、生成时间,相干链接等信息),去除所搜集网页荟萃中主题内容重复或链接的网页。根据肯定的相干度算法进行大量的计算得出网页的紧张性(或相干度),然后行使这些相干信息为原始网页建立索引,并对索引网页库进行网页切分,将每一篇网页转化为一组词的荟萃;最后将网页索引词的映射转化为索引词到网页的映射,形成倒排文件(包括倒排表和索引词表),同时将网页中包含的不重复的索引词汇聚成索引数据库。查询服务提供友爱的查询界面,接受用户提交的查询义务,并根据要求从索引数据库中找到吻合要求的所有相干的网页,按照肯定的规则排序输出。

相干阅读:网站的搜索引擎优化


相关:搜索 搜索引擎 索引 引擎 概述