* 新闻详情- */>
免费预约专业提供网站解决方案
如下:
1、权重优先:先参照链接的权重,再综合深度优先和宽度优先策略抓取。打个比方,如果这条链接的权重还不错,就采用深度优先;如果权重很低,则采用宽度优先。
2、重访抓取:这个就可以直接字面上理解。因为搜索引擎使用单个重访与全部重访结合的居多。所以我们做网站内容要记得定期维护日常更新,让蜘蛛多来访多抓取才能收录快。
二、处理网页。
搜索引擎抓取到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、超链接分析、计算网页的重要度/丰富度等。
处理网页分为以下几个部分:
1、网页结构化:HTML代码全部删除掉,提取出内容。
2、消噪:留下网页的主题内容。
3、查重:查找删除重复的网页与内容。
4、分词:提取出正文的内容后,分成若干个词语,然后排列存入索引库。同时计算这个词在这个页面出现了多少次。有必要指出,关键词堆砌就是借用这个原理对网站进行优化。这种做法属于作弊。
5、链接分析:搜索引擎会查询分析这个页面的反向链接有多少,导出链接有多少内链,然后判定这个页面多少权重。
内容质量:网站有大量高质量的原创文章,可以提供用户的可读性,用户通过搜索关键词进入到网站,文章内容是可以满足用户的需求。内容质量有利于提高网站内容收录和提高网站权重,网站权重的提高了才能带动大量长尾词获得排名。一个网站跳出率越高就说明该网站对用户的吸引力太低,搜索引擎对网站的评价也会随之下降,所以跳出率是衡量网站内容质量的重要标准之一。跳出率是用户访问网站,只浏览了一个页面就离开,说明了用户当前浏览的页面价值性不高,没有在页面获取到用户想要的答案。跳出率计算公式:跳出率=访问一个页面后离开网站的次数/总访问次数
影响网站跳出率主要因素有哪些?流量渠道:通过广告引流进来的用户,基本是给广告的某一点吸引而来,抱着看看的心态,如果网站没有什么特点,用户也不会花过多的时间停留。通过搜索关键词访问的用户,流量质量会相对比较好,可以通过百度统计里去分析网站的跳出率情况。综合浏览速度:网页的浏览速度也是影响网站跳出率重要因素之一,用户访问到网站如果一个页面的跳转时间太长,用户没有耐心等会选择直接关闭窗口离开,搜索引擎则会认为这个网站的用户体验不好,自然不会给好的排名,用户打开网页能够接受等待时间为3秒。因此网站的打开速度是需要优化的。
低质量页面的特征1、主需求无效、满足不了用户的需求,如过期分类广告、软件下载页面、载链接无效等等;2、页面出现死链接;3、页面出现虚假、诈骗信息等;4、页面是空页面,没有内容;5、站点不稳定从而影响页面打开速度,降低页面质量;6、用户不能直接获取所需求的东西,如论坛不登陆看不了文章等等;7、信息不完整,以及转载的内容完整;8、浏览体验差,如过度的广告,文字看不清等等。
下一篇:苏州建站教程推荐
申请获取免费网站建设解决方案