Google 网页爬虫报告无法连接站点解决办法
浏览:1822次 出处信息
几次收到Google站长工具发来的Googlebot无法访问shentar.me的邮件,感觉很奇怪,空间是托管在香港的,不可能出现Google无法连接的问题。
在网上搜索了一下,也早有同学报告类似问题,咨询了主机空间提供商,说是域名解析的问题。的确是用的国内的某大型知名免费域名解析服务提供商的免费服务。用了快3个月了,之前一直好好的,突然就开始设卡了,估计是希望我去买他们的付费服务。即使没有国外的DC,也不用全天都不让Google访问啊。只好再找另外一家类似的服务了,马上修改。
测试了一下,是比原来那家慢了很多,但是应该不会再出现无法抓取的问题。
只保留了news.shentar.me的域名在原来的DNS服务商那里。
到GoDaddy修改域名托管服务器时,想了一下,何不两家的解析服务都用呢,于是将托管服务器注册为了两家的,将两家的第一域名解析服务器分别作为本站的第一和第二域名解析服务器。这样在解析速度和Google建立连接上面有一个权衡,大功告成。dig +trace验证,果然是交叉的,有时是从第一家返回的,有时是从第二家返回的。


Google无法连接其中的一家,自然会去连备用的。不至于全天都无法连接而删除索引了。虽然域名服务商告诫不要混合使用,但是感觉并没有什么不妥。
建议继续学习:
- 怎样用好Google进行搜索 (阅读:15315)
- 使用python爬虫抓站的一些技巧总结:进阶篇 (阅读:12753)
- 使用python/casperjs编写终极爬虫-客户端App的抓取 (阅读:12439)
- Google怎么用linux (阅读:11964)
- 使用python/casperjs编写终极爬虫-客户端App的抓取 (阅读:10355)
- 使用python爬虫抓站的一些技巧总结:进阶篇 (阅读:7165)
- 简析搜索引擎中网络爬虫的搜索策略 (阅读:6807)
- Google短网址的API (阅读:5978)
- 聚焦爬虫:定向抓取系统的实现方法 (阅读:5493)
- PHP 性能优化技巧-google (阅读:5487)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
扫一扫订阅我的微信号:IT技术博客大学习
<< 前一篇:RDS典型客户工单——空间问题
后一篇:配置 Nginx 子域名的泛解析 >>
文章信息
- 作者:童燕群 来源: 忘我的追寻
- 标签: Google 爬虫
- 发布时间:2014-11-19 23:20:32
建议继续学习
近3天十大热文
-
[927] WordPress插件开发 -- 在插件使用 -
[133] 解决 nginx 反向代理网页首尾出现神秘字 -
[52] 如何保证一个程序在单台服务器上只有唯一实例( -
[52] 整理了一份招PHP高级工程师的面试题 -
[50] 全站换域名时利用nginx和javascri -
[50] 海量小文件存储 -
[50] 用 Jquery 模拟 select -
[49] CloudSMS:免费匿名的云短信 -
[48] Innodb分表太多或者表分区太多,会导致内 -
[47] jQuery性能优化指南
