查看: 1072|回复: 0

[搜索优化SEO] 浅析蜘蛛爬行的思路让网站获得更好的收录

[复制链接]
发表于 2010-12-18 16:25 | 显示全部楼层 |阅读模式
  大家好,我相信很多站长朋友都对蜘蛛不陌生吧?做网站的基本都知道蜘蛛是什么,其实蜘蛛就是一个搜索引擎的爬取程序,用来收录网站,然后在搜索引擎里面搜索程序出来的页面,那么蜘蛛它爬取的原理有哪些,今天我给大家来分享一下我对蜘蛛的了解以及看法。

  一、蜘蛛爬取原理

  大自然的蜘蛛我相信大家都看到过,它是通过网来进行爬取的。而搜索引擎的蜘蛛是通过链接来爬取的。蜘蛛在网页上爬取到一个链接就会把它放到一个单独的数据库。这些数据库都是有特性的,特性就是域名的后缀。

  常用的后缀有.net、.org、.com、.cn、.com.cn等等。

  蜘蛛会把这些域名后缀的链接放到一个数据库,然后逐个去爬取,这可能是很多站长朋友的一个误区。蜘蛛是不会像用户一样直接点击进入的,如果那样,那么这个蜘蛛就可以一直在外面不用回家了。因为每个网页都是有链接不断的循环的,爬不完的。

  百度反向链接蜘蛛也是会爬取的,有些朋友称之为相关域。百度相关域的意思就是说,只有一个页面被百度收录了,并且这个页面包含你的域名,比如:www.xxxxx.com ,这不是一个超链接,但是只有百度收录了我写的这篇文章的页面,那么蜘蛛是会把这个域名列入它的数据库的,然后也会爬取。并且也会计算权重,这就是我们所说的链接诱饵,用来吸引蜘蛛。

  二、如何加快百度快照以及收录

  百度快照的更新是因为蜘蛛重新抓取了你网站的页面,发现你的内容有改动,所以就会返回快照日期。当然有些朋友就会说,我的网站一个多月甚至更久都没有更新过,但是我的快照依然每天更新,这个你怎么解释。这个是因为你的网站权重高,蜘蛛经常来你的网站,这个它也是会不断的返回数据,更新你的百度快照。所以总结一点,想让快照更新快,其中很重要的一点就是吸引蜘蛛来到你的网站,如果蜘蛛都不来,那么百度如何更新?除非你和李彦宏有一腿(后面省略300字)。

  那么如何加快收录呢?不知道各位站长朋友是否发现这样一个现象。查看IIS日志的时候,发现某个页面被蜘蛛爬取过,但是没有收录,过了一阵子又发现被收录了。这是为什么?这个原因很简单,蜘蛛不可能来一次就爬取你网站里面的所有页面,也不可能把所有爬取的都收录,那样数据量太庞大,服务器压力太大。蜘蛛来到网站以后会把页面下载到它自己的数据库,然后进行分析。分析内容,然后计算一个分数,再来评分。那么想要加快收录,结合我上面说的引蜘蛛,让蜘蛛不断的来到你的网站,并且更新一些用户度了有用的文章。不一定要是原创,或者伪原创。

  很多朋友不解,都说网站更新要原创和伪原创,你这样复制人家的,百度会K掉你的,重复了。其实并非这样,说到这里,这就涉及到一个用户跳出率的概念了。百度收录一篇文章,也是会通过用户的喜好来判断的,如果你这篇文章有用,用户喜欢,那么一样会收录的,因为用户有需求。只有呈现给用户好的,才叫高质量的文章,而并非是你自己改改标题,颠倒一下文章顺序,就是一篇好的文章。

  始终记住一点,搜索引擎是为用户服务的,一切符合用户的设计,就是符合搜索引擎。

  今天就先介绍到这里,如果哪位朋友看了这篇文章,有些想法,都可以在下面留下你宝贵的意见,我们可以一起探讨关于真正的SEO。顺便说一句,想快速的增加链接诱饵,可以在A5论坛买个邀请码,在论坛签名里面带上你的链接,不断的回帖,蜘蛛会很快的去你网站的,因为A5权重高,页面很快被收录,收录了就会帮你网站加一个百度相关域,蜘蛛也就会去你的网站了。
温馨提示:
1、本内容转载于网络,版权归原作者所有!
2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

客服QQ/微信
2743073287 周一至周日:09:00 - 22:00
十五年老品牌,学习网上创业赚钱,首先轻创资源网,值得信赖!
轻创资源网 版权所有!

本站内容均转载于互联网,并不代表轻创资源网立场!
拒绝任何人以任何形式在本站发表与中华人民共和国法律相抵触的言论!

赣ICP备2023011851号-1

QQ|小黑屋|广告服务|加入vip|轻创网APP下载|手机版| 轻创资源网

GMT+8, 2024-11-26 03:46 , Processed in 0.088664 second(s), 32 queries .

快速回复 返回顶部 返回列表