切它网B2B商人社区(Club.QieTa.com)

 找回密码
 去切它网注册帐号

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
热搜: 切它网 B2B
查看: 651|回复: 0
打印 上一主题 下一主题

百度站长平台:如何识别Baiduspider 保证网站被正常抓取

[复制链接]
  • TA的每日心情

    2014-4-25 17:05
  • 签到天数: 2 天

    连续签到: 1 天

    [LV.1]初来乍到

    新浪微博达人勋

    跳转到指定楼层
    楼主
    发表于 2014-4-25 17:05:24 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    有不少网站出现过误封Baiduspider的行为,对网站的收录造成影响。甚至有网站反映百度蜘蛛行为异常光顾过于频繁。近期百度站长平台表示Baiduspider对该站点的抓取并无异常,并发布教程帮助站长识别Baiduspider,并加入白名单。

      上周百度站长平台接到某站长求助,表示误封禁了Baiduspider的IP,询问是否有办法获得Baiduspider的所有IP,打算放入白名单加以保护,防止再次误封。在此要告诉各位站长,Baiduspider的IP池是不断变动的,我们无法提供IP全集。

      除此之外,之前还有站长发来质疑说Baiduspider光顾过于频繁,已超越服务器承受能力。而百度站长平台追查发现,Baiduspider对该站点的抓取并无异常,那只spider极有可能是个李鬼。

      那么,站长该如何通过IP来判断此spider是不是来自百度搜索引擎的呢?

      可以通过DNS反查方式来解决这个问题。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:

      1,在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或*.baidu.jp 即为冒充。

      2,在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或*.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

      3,在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或*.baidu.jp 即为冒充。


    原创:9weiduoliyayulecheng.com

    日期:2014年4月25日


    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏 分享到新浪微博
    我的商铺网站:http://lin374217.shop.qieta.com
    回复

    使用道具 举报

    本版积分规则

    关于我们 | 联系我们 | 使用协议 | 隐私保护 | 付款方式 | 网站地图 | 友情链接 | 网站留言 | 广告服务
    © 2006-2012 QieTa B2B SYSTEM sn All Rights Reserved
      
    快速回复 返回顶部 返回列表