Précision préalable : cet article a été écrit début 2014 et j’avais tout simplement oublié de le publier, mais il reste valable.
Comme pas mal de monde j’utilise de temps à autres la fonction « URL à supprimer » de Webmaster Tools qui permet de supprimer une URL, un répertoire ou un site de l’index de Google. Mais savez-vous réellement quels sont les effets de cette fonctionnalité ?
Si vous n’avez pas le temps de lire l’article, sachez que la conclusion est que Google applique un filtre empêchant la présentation des URL du répertoire dans les SERP pour une période de 90 jours.
J’ai découvert récemment que les effets de cette fonction étaient bien différents de ce que j’avais en tête. Je m’en suis rendu compte lorsque j’ai récupéré le SEO d’un site qui avait (très mal) géré ses facettes : tout était crawlable et indexable. Les facettes pouvaient avoir pour URL :
- /c/nom-categorie/filtre/valeur1/valeur2.html
- /c/nom-categorie/filtre/valeur2/valeur1.html
- /c/nom-categorie/filtre/valeur4/valeur1/valeur3//valeur2/valeur5.html
- etc.
Le tout répondant en 200 (même si le filtre menait à zéro résultats) et étant indexable. Le site e-commerce en question propose environ 800 produits. La commande suivante :
site:site.com inurl:/filtre/
renvoyait 68 000 résultats… Bref, un bon gros foutoir.
Sur toutes ces pages, seules les pages ne filtrant que sur une seule valeur apportaient du trafic (les pages /c/categorie/filtre/valeur1.html). J’ai voulu rapidement désindexer les pages combinant deux filtres ou plus, donc /c/categorie/filtre/valeur1/(.*).html mais conserver celles ne filtrant que sur une seule valeur.
Pour faire simple et rapide, j’ai voulu procéder de cette manière :
- utiliser Webmaster Tools pour supprimer totalement les répertoires /c/categorie/filtre/
- placer une META Robots noindex sur les /c/categorie/filtre/valeur1/(.*)
- retirer tout lien vers les pages type /c/categorie/filtre/valeur1/(.*)
- laisser Google réindexer les pages avec un filtre sur une seule valeur, donc /c/categorie/filtre/valeur1.html
Je me donc suis rendu dans Webmaster Tools, j’ai indiqué les dossiers à désindexer les URL suivantes (vu le nombre, j’ai fait tourner ma macro iMacro pour désindexer des URL en masse dans Webmaster Tools) :
- /c/categorie1/filtre/
- /c/categorie2/filtre/
- /c/categorie3/filtre/
- etc.
Le lendemain, la commande :
site:site.com inurl:/filtre/
Ne renvoyait plus aucun résultat. Impeccable.
La balise Meta Robots noindex étant mise en place sur les pages combinant plusieurs filtres et les liens vers les combinaisons de filtres étant coupés, j’ai sagement attendu que Google recrawle les pages de filtres à une valeur pour qu’il les réindexe. Ainsi, je n’aurais plus dans les SERP que les URL ne filtrant que sur une valeur, celles qui m’apportaient du trafic.
Les jours ont passé, Google crawlait bien ces pages, fréquemment, mais aucune n’apparaissait dans l’index.
3 jours passent. Rien dans l’index. Puis 7 jours, rien. 10 jours, rien. 2 semaines, toujours rien alors que Google a crawlé plusieurs fois toutes les pages ! Damn !
Alors j’ai bien relu la documentation de Google et je me suis rendu compte que Google indiquait clairement que cet outil était une sorte de mesure d’urgence pour ne pas afficher une URL ou un répertoire dans l’index pour un temps déterminé… et qu’il ne fallait pas l’utiliser comme un moyen de « faire le ménage » ! J’ai donc supprimé cette règle de Webmaster Tools et, dans les heures qui ont suivi, les URL de filtres sont réapparues dans Google, toutes celles ayant un filtre sur une seule valeur, et celles ayant des filtres sur plusieurs valeurs !
A vous de voir ce que ça implique, mais en clair :
- Les pages continuent d’être crawlées
- Quand bien même certaines seraient indexables, elles ne seront pas affichées dans les résultats de recherche
- On ne peut donc pas se dire :
- Je vais désindexer tout un répertoire pour nettoyer
- Je vais placer du noindex par ci par là
- J’attends de voir mes URL non noindex revenir
C’est donc juste un filtre, qui plus est temporaire, et qui se moque de savoir si la page devrait être indexée. Si elle correspond à une URL ou appartient à un répertoire à masquer, elle ne sera pas affichée.
You’ve been warned !
Abonnez-vous au flux flux RSS | You can skip to the end and leave a response. Pinging is currently not allowed.