桂林欣梦网络科技有限公司
做品牌,找我们
让您的品牌赢在起跑线上!
地 址:广西省桂林市七星区创意产业园3栋1单元402
电 话:默认值
传 真:默认
网 址:https://www.on1.net.cn
给我们留言
如果有需求请花几分钟时间在下边表格上填妥需求信息,我们将针 对您的需求与您取得联系~
搜索引擎的工作的过程其实非常复杂,而简单的讲搜索引擎的过程大体可以分成三个阶段。爬行和抓取:搜索引擎蜘蛛通过跟踪链接访问页面,获取页面HTML代码存入数据库。预处理:搜索引擎对抓取来的页面数据文字进行文字提取、中文分词、索引等处理,以备排名程序调用。排名:用户输入关键字后,排名调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。
哪些页面被认为比较重要呢?有几方面影响因素:
网站和页面权重。质量高、资格老的营销型网站被认为权重比较高,这种网站上的页面被爬行的深度也会比较高,所以会有更多内页被收录。
页面更新度。蜘蛛每次爬行都会把页面数据存储起来。如果第二次爬行发现页面与第一次收录的完全一样,说明页面没有更新,蜘蛛也就没有必要经常抓取。如果页面内容经常更新,蜘蛛就会更加频繁地访问这种页面,页面上出现的新链接,也自然会被蜘蛛更快跟踪,抓取新页面。
导入链接。无论是外部链接还是同一个网站的内部链接,要被蜘蛛抓取就必须有导入链接进入页面,否则蜘蛛根本没有机会知道页面的存在。高质量的导入链接也经常使页面上的导出链接被爬行深度增加。一般来说网站上权重最高的是首页,大部分外部链接是指向首页,蜘蛛访问最频繁的也是首页。离首页点击距离越近,页面权重越高,被蜘蛛爬行的机会也越大。


