科技

当前位置/ 首页/ 要闻频道/科技/ 正文

爬虫robots协议(robots协议)

导读 当前大家对于robots协议都是颇为感兴趣的,大家都想要了解一下robots协议,那么小美也是在网络上收集了一些关于robots协议的一些信息来分

当前大家对于robots协议都是颇为感兴趣的,大家都想要了解一下robots协议,那么小美也是在网络上收集了一些关于robots协议的一些信息来分享给大家,希望能够帮到大家哦。

1、robots协议也称爬虫协议、爬虫规则等,是指网站可建立一个robots.txt文件来告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取,而搜索引擎则通过读取robots.txt文件来识别这个页面是否允许被抓取。

2、但是,这个robots协议不是防火墙,也没有强制执行力,搜索引擎完全可以忽视robots.txt文件去抓取网页的快照。

3、 如果想单独定义搜索引擎的漫游器访问子目录时的行为,那么可以将自定的设置合并到根目录下的robots.txt,或者使用robots元数据(Metadata,又称元数据)。

4、robots协议并不是一个规范,而只是约定俗成的,所以并不能保证网站的隐私。

本文到此结束,希望对大家有所帮助。

免责声明:本文由用户上传,如有侵权请联系删除!