MD,说多了都是泪。昨天半夜不知道哪根筋搭错了,看到搜狗搜索结果页下面老跟着一串showinfo=xxx的参数,就觉得这玩意儿会不会分散蜘蛛权重啊(典型的焦虑症晚期),然后就想着给它毙了。
血的教训先拍在这儿:如果你不懂,千万别去动robots.txt里关于搜狗蜘蛛(Sogou web spider)的规则,尤其别直接用Disallow: /*?*这种一刀切的蠢办法——这是我用整整一周的收录停滞和主力关键词排名掉没换来的认知,当时看着统计后台那条笔直向下的线,我抽了半包烟都没想明白问题出在哪儿,后来才反应过来是我把带问号的动态URL全屏蔽了,结果连正常的带参数页面(比如分页、筛选页)蜘蛛也进不来了,真是蠢到家了。
回归正题,你要真想禁用搜狗showinfo这个追踪参数,正确的、相对安全的思路不是去粗暴地拦截蜘蛛,而是在技术层面阻止这个参数生成,或者让它无效。搜狗这个参数主要是用来追踪点击来源的,对SEO本身其实没啥直接影响(我后来才悟了,纯属庸人自扰)。最稳妥的方法:
- 检查你的网站生成搜索代码的插件或模块,看看有没有地方能关闭或移除对搜狗搜索的代码推送。很多站用第三方分享、统计工具会自带这个。
- 在服务器层面(如Nginx)或网站程序里做URL重写(Rewrite),将包含
showinfo=的访问请求,301重定向到干净的URL上。但这个需要点技术,搞不好会弄出循环重定向,又是一坑。 - 躺平,别管它。 真的,除非它引发了严重的技术问题(比如导致页面重复、参数错误),否则为了这个去折腾,风险收益比极低。有这功夫不如去搜狗站长平台好好研究下怎么提交适配移动端的页面,或者优化下TDK,比啥都强。
最后唠叨一句,新站或者权重不高的站,千万别把robots.txt当成玩具随便改,每写一条规则都想想后果,搜索引擎尤其是国内这些,蜘蛛爬取逻辑有时候很玄学,你以为是优化,在它看来可能就是“此路不通”。我那破站就是前车之鉴,现在还在慢慢恢复元气,真想回到过去给当时手贱的自己一耳光。
