当前位置:首页 > 网站优化 > 正文

SEO爬虫优化的误区?避开这些坑提升效率!

今天想唠唠搞网站SEO爬虫优化踩的那些坑,都是真金白银换来的教训。上个月我吭哧吭哧把网站翻新了一遍,结果流量反而掉得跟滑滑梯似的,气得我半夜爬起来查原因。

SEO爬虫优化的误区?避开这些坑提升效率!

刚开始傻乎乎乱搞

当时听说让爬虫多抓能提升排名,我直接在服务器里塞了个爬虫插件,把抓取频率拉到最高档。好家伙,第二天网站慢得像蜗牛爬,手机打开首页要等10秒!更气人的是,搜索排名直接跌出三页开外。

我不服输,抄起工具就查服务器日志。这才发现爬虫跟疯狗似的在啃我网站:

  • 把后台登录页当宝贝抓了100多遍
  • 对着用户个人资料页疯狂刷新
  • 连图片打包下载的废链接都不放过

拿自己网站做实验

我拿出修车铺老师傅的架势,蹲在电脑前改配置。先照着教程建了个爬虫指引文件,把不该抓的页面全列进去:

  • 购物车和结账页面
  • 带?的临时链接
  • 后台管理系统

结果第二天查日志差点气笑——爬虫确实不抓后台了,但开始玩命刷新网站的404报错页,两天扫了三百多次!

终于摸到门道

后来泡技术论坛才开窍,光拦着没用,得主动给爬虫指路。我在网站根目录做了个站点地图,像导游图似的标出:

  • 重点产品的详细页
  • 干货文章的合集页
  • 用户常搜的问题解答

顺便把爬虫抓取速度调到乌龟模式。改完当天服务器报警就消停了,CPU占用从90%暴跌到30%。更惊喜的是两周后,重点产品页悄悄爬回了搜索首页。

现在想想真后怕,之前完全是抱着机关枪打蚊子。爬虫优化就三个诀窍:把垃圾页面锁进保险箱,给黄金通道铺红地毯,最重要是让爬虫悠着点儿来。上周客户网站卡成PPT,我按这个方法折腾了半小时,今早就收到他发红包说订单涨了20%。这玩意儿试错成本太高,希望你们别走我的老路!