地址最后不加斜杠,我整个站的权重被稀释光了,真想抽自己...

玛德,现在想起来手都在抖!你以为网站做出来就完了?最特么坑人的就是这些细节,细节!我当时图省事,全站链接地址有的是 /page 有的是 /page/ 结尾,就这一个斜杠的区别,百度和谷歌蜘蛛直接给我识别成两套完全不同的页面,原创文章还没收录呢,先在搜索引擎那里给我整出几百个重复内容,权重像沙漏一样哗哗往下掉,凌晨四点收到百度资源平台警告邮件说疑似内容重复度异常,我点开一看血压直接飙到180,盯着后台那断崖式下跌的索引量曲线,那感觉比吃了十斤苍蝇还恶心。

这玩意儿业内叫URL规范化,说白了就是得统一,要么全加斜杠要么全不加。很多CMS默认就有这毛病,你上线前不调好,后期改起来全是301重定向,改一个死一片内链,改得你怀疑人生。我当时就是觉得“差不多得了”,结果呢?差不多先生差点把站给送走。

还有更傻X的,把绝对地址和相对地址混着用。今天用 ./img/1.jpg,明天手一抖写成 http://你的域名/img/1.jpg,后天外包的兄弟给你整一套 ../assets/xx.js,好家伙,等你换域名或者上HTTPS的时候,你就哭吧,全站资源404,图片不显示,JS全报错,用户体验?用户体验就是直接关掉你的破站!搜索引擎一看,你这站这么多死链,得,再扣一波分。所以记住,内部资源链接,尤其是图片、CSS、JS这些,必须用相对路径从根目录开始写,也就是 /img/1.jpg 这种,一劳永逸。

再提一嘴TDK里的地址,也就是 canonical 标签,很多兄弟根本不知道这玩意是干嘛的。你一个产品详情页,因为有颜色、尺寸参数可能生成 N 个带参数的URL,如果你不指定一个 canonical 地址告诉搜索引擎“老大,这个才是正宗原版”,蜘蛛又蒙圈了,又给你算重复,权重又双叒叕被分散。所以,但凡有动态参数的、可能有多个访问入口的页面,一定要在代码里把 canonical 写上,指向你希望被收录的那个最干净的地址。

血的教训换来的,别问我是怎么知道的。你要是刚起步,对这块头皮发麻,强烈建议你找个靠谱的框架或者直接看看 那些被搜索引擎毒打过的老鸟留下的保命文档,里面关于URL结构、死链检查、权重集中的坑都写得明明白白,能帮你省下至少半年试错的时间,真的,听句劝。

地址怎么写?这不是技术问题,这是策略和纪律问题。从一开始就定好规矩,所有链接、所有资源,全站保持绝对统一,像强迫症一样去检查。不然等算法过来找你收“不规范税”的时候,你交出去的可是真金白银的时间和流量。不说了,我抽根烟,去查查我新站的日志,看看今天蜘蛛有没有迷路。

相关推荐