刘连康:教你如何正确认识百度蜘蛛(BaiduSpider)IP段

刘连康
刘连康
刘连康
532
文章
10
评论
2020年9月7日21:04:37 评论 349 2691字阅读8分58秒

百度蜘蛛是一个自动程序,它的英文名称叫做BaiduSpider。由于百度蜘蛛是我们人类设计和制造出来一个产物,因此它每天都会按照我们人类的思维方式,在互联网上爬行和抓取网页、图片和视频等内容,然后分门别类建立索引数据库,使用户能在百度搜索引擎中搜索到自己想要的东西。

刘连康:教你如何正确认识百度蜘蛛(BaiduSpider)IP段

我们做的是网站SEO,因此研究百度蜘蛛对网站优化很有好处。如果你想知道百度蜘蛛有没有来你的网站,它都抓取了哪些网页,状态码是什么等等,我们都可以通过网站日志来查看。

 

网站日志是一个神奇的东西,可以看得出百度蜘蛛的工作情况究竟是怎么样的。

 

当然,网站日志也可以看得出哪个地区的人在你网站上面做坏事,比方说:有人眼红你的网站,用ddos或者是CC攻击你的网站,让你的网站一天到晚打不开,你就可以通过网站日志查看是哪个地区的IP。

 

其实康哥很少研究网站日志,因为康哥做SEO都是使用正规手法,从来不作弊,文章也都是原创为主。说得简单些,只要是经过我们SEO过的网站,都不会出现那种很严重的什么降权啊、进入沙盒很久很久之类的啊等等问题。

 

不过呢,有些做SEO的朋友也经常来请教过康哥怎么查看网站日志里面的百度蜘蛛IP段,比方说他们想要知道:哪些IP段是百度来的,哪些IP段是百度权重IP,也想知道哪些IP段是进入沙盒或者是降权的IP段等等。

 

这种问题很简单,下面康哥就给你们详细的介绍一下好了,希望能对你们研究百度蜘蛛有所帮助。

 

如果你的网站是123.125.68.*这个IP段的百度蜘蛛经常来,别的来得比较少,那就表示你的网站可能要进入沙盒了,或者是被降权。

 

220.181.68.*每天这个IP段只是不断增加,不曾看见减少,很有可能进入了沙盒或者是被K站。

 

对了,说到这里康哥就不得不给你们介绍一下什么是百度沙盒,有些SEO新手朋友还是不太明白,有必要科普一下哈。

 

百度沙盒也就是说你的网站不会马上就被百度封杀掉,但是却无法获得很好的排名。你网站有好多关键词原本有不错的排名,突然有一天就消失不见了,这就是典型的进入了沙盒。

 

还有一个情况也会把你网站搞到沙盒里面去,那就是一个网页里面的关键词链接,也就是你们常说的什么锚文本。

 

如果你在一个网页里面做四五个关键词链接,或者是做更多的关键词链接进去,那么你的网站必然也会被百度放进沙盒。

 

因此,大家要合理的去优化网站内部链接,一篇文章只做1-2个关键词链接即可,千万不要贪多。相反,网站里面的文章你写多少进去都可以,越多越好,要尽可能原创。

 

不扯那么多了,我们还是继续来研究一下百度蜘蛛(BaiduSpider)IP段。

 

220.181.7.*、123.125.66.* 代表百度蜘蛛IP造访,准备抓取你网站内容。

 

121.14.89.*这个IP段作为度过新站考察期,也就是我们刚才讲的百度沙盒。

 

203.208.60.*这个IP段出现在新站及站点有不正常现象。

 

210.72.225.*这个IP段不间断巡逻各站。

 

125.90.88.* 这个IP段的地区是广东茂名市电信,也属于百度蜘蛛IP段,主要是造成成分,是新上线站较多,还有使用过站长工具,或者是SEO综合检测造成的。

 

220.181.108.95这个是百度抓取首页的专用IP,是百度蜘蛛的权重IP段!

 

如果你的网站是220.181.108.*段不断来抓取的话,康哥可以很负责任的告诉你:你的网站会天天得到百度蜘蛛的抓取和更新,发布的文章秒收录不是问题,绝对错不了。

 

220.181.108.92也是跟刚刚讲的IP段一样,有98%的几率是抓取你网站首页,可能还会抓取其他 ,不一定就是内页。

 

大家要注意了,220.181.108*段都是属于百度蜘蛛权重IP段,此IP段爬过的文章或者是首页基本上24小时之内会给你放出来!

 

123.125.71.106是抓取网站内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因为不是什么原创文章。

 

220.181.108.91属于综合的,主要抓取首页和内页或者是其他,也是属于百度蜘蛛的权重IP段,爬过的文章或者是首页基本24小时之内就会放出来。

 

220.181.108.75重点抓取更新文章的内页,抓取率能够达到90%,8%抓取首页,2%其他。也是百度蜘蛛权重IP 段,爬过的文章或者是首页基本上是在24小时之内放出来。

 

220.181.108.86专用抓取网站首页IP 权重段,一般返回代码是304 0 0,代表未更新,意思就是说这个IP段的百度蜘蛛已经访问过你的某个网页了,只是它发现你这个网页没有更新过任何内容。

 

123.125.71.95这个IP段是抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因为不是原创文章。

 

123.125.71.97也是一样,抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因为不是原创文章。

 

220.181.108.89是专用抓取首页IP权重段,一般返回代码是304 0 0,代表未更新。

 

220.181.108.94专用抓取首页IP权重段,一般返回代码是304 0 0,代表未更新。

 

220.181.108.97专用抓取首页IP权重段,一般返回代码是304 0 0,代表未更新。

 

220.181.108.80专用抓取首页IP权重段,一般返回代码是304 0 0,代表未更新。

 

220.181.108.77 专用抓首页IP权重段,一般返回代码是304 0 0,代表未更新。

 

123.125.71.117 抓取内页收录的,权重较低,爬过此段的内页文章不会很快放出来,因为不是原创文章。

 

220.181.108.83专用抓取首页IP权重段,一般返回代码是304 0 0,代表未更新。

 

到了这里大家要注意一下:其实呢,康哥给你们讲到的以上百度蜘蛛IP尾数还有很多很多。

 

但是如果你在网站日志看到了很多段位一样的123.125.71.*IP,那就代表百度蜘蛛抓取内页,并且收录的权重会比较低,原因就在于你的网站是采集文章或者是拼接文章,暂时被百度收录了,但是不给你放出来,也就是待定的意思。

 

220.181.108.*段IP主要是抓取网站首页,抓取率占到了80%,内页占30%,这个IP段的百度蜘蛛爬过的文章或者是首页,绝对是24小时内放出来和隔夜快照的。

 

好了,今天有关于百度蜘蛛(BaiduSpider)IP段的研究康哥就已经给大家讲解完毕,如果你的网站SEO排名很不理想,站内站外也都优化过了,也不见起作用,那就赶紧从FTP里面下载网站日志研究一下吧。

 

本文为原创文章,版权归作者所有,欢迎转载,转载请注明作者和出处,谢谢!

作者:刘连康

首发:刘连康博客

  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin
刘连康
  • 本文由 发表于 2020年9月7日21:04:37
刘连康:网站内容如何做SEO诊断? SEO新闻资讯

刘连康:网站内容如何做SEO诊断?

记得康哥曾经给你们说过这样一句话:一个网站,没有内容是不行的,它在SEO中的重要性占到了80%的份额。因为内容是做好用户体验和留住客户最关键因素,好的内容和好的体验会给用户带来更好的享受。  ...
刘连康:广度优先和深度优先的区别 SEO新闻资讯

刘连康:广度优先和深度优先的区别

有从事过SEO工作的朋友应该知道,百度搜索引擎蜘蛛是通过抓取网络上的URL进行工作的。而这个URL的抓取策略又可以分为两种,一种是深度优先策略,另外一种就是广度优先策略。   今天康哥就给你...
刘连康:SEO要学什么代码? SEO新闻资讯

刘连康:SEO要学什么代码?

代码有很多种,比方说html代码、JS代码和php代码等等,基本上是由美国佬发明创造出来的一些产物,而这些美国人的母语就是英语。所以你们在网络上看到的代码全都是英文和一些奇形怪状的字体,很难找得到汉字...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: