真正的搜索引擎由蜘蛛程序沿着链接爬行并抓取网上的大量页面,存进数据库,经过预处理,生成索引库,用户在搜索框输入查询词后,搜索引擎排序算法从索引库中挑选出符合查询词要求的页面并排序显示。蜘蛛程序的爬行、页面的索引及排序都是自动处理的。
搜索引擎的工作过程大体可以分成三个阶段。 (1)爬行和抓取:搜索引擎蜘蛛通过跟踪链接发现和访问网页,读取页面HTML代码,存入数据库。 (2)预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引、倒排索引等处理,以备排名程序调用。 (3)排名:用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。
本书详细和系统地介绍了正规、有效的SEO实战技术,包括为什么要做SEO、搜索引擎工作原理、关键词研究、网站结构优化、外部链接建设、SEO效果监测及策略修改,SEO作弊及惩罚、排名因素列表、常用的SEO工具、SEO项目管理中需要注意的问题等专题,最后提供了一个非常详细的案例供读者参考。
我是从本书学到了很多有用的知识,如果大家喜欢的话可以去购买正版,支持一下作者。