一、什么是模拟蜘蛛抓取
站长可以输入自己网站上的任何一个网址,网管工具会发出Google蜘蛛,实时抓取页面内容,并显示出抓取的HTML代码,包括服务器头信息和页面代码。
另外工具也可以用来检查页面是否被黑。有时候黑客放入的代码会检查浏览器类型,如果是用户使用普通浏览器访问则返回正常内容,如果是搜索引擎蜘蛛访问,才返回黑客加上去的垃圾内容和垃圾链接。
所以站长自己访问网站看不出异样,Google蜘蛛抓取到的却不是站长自己看到的内容。这个工具可以帮助站长检查页面是否存在安全漏洞。
二、抓取错误及统计
抓取错误部分列出404错误(页面不存在)、被robots文件禁止而不能收录的页面等。其中404错误对检查网站上是否存在错误链接很有用。对每个404错误,网管工具都会列出这个网址的链接。
如果到不存在页面的链接是网站内部发出的,说明这些链接页面上的链接地址有错误。如果链接向不存在页面的是其他网站,站长可以尝试联系对方更改错误链接到正确位置。
关注“柒点传媒”
关注“企师爷”
湖南省柒点文化传媒有限公司 版权所有