La semaine dernière, nous avons parlé des « gestes qui sauvent » pour éviter que votre site de préprod (test) soit indexé par les moteurs de recherche. Mais que faire si cela arrive ? Voici une procédure en 5 étapes à appliquer dans ce cas, procédure d’ailleurs également valable pour toute page indexée dans un premier temps puis interdite au crawl par la suite et apparaissant dans la Search Console avec le message « Indexée malgré le blocage par le fichier robots.txt ».

Lors de la mise en place d’un nouveau site web ou dans le cadre d’une refonte/migration, nous utilisons généralement un site de test (appelé « pré-prod » pour la pré-production, donc avant de passer en production) où nous vérifions que tout fonctionne. d’accord Et une fois que tout va bien, nous changeons ce site en site réel, appelé « production ».

Bien entendu, ce site de pré-production n’a pas vocation à être indexé par des moteurs de recherche comme Google ou Bing. Cependant, cela arrive parfois, en raison d’une erreur ou d’une erreur humaine. Il faut donc corriger cela et désindexer ce site d’intrusion, mais ce n’est pas forcément très simple à faire. Bref, il faut suivre une procédure.

On a vu la semaine dernière ce qu’il fallait faire au départ, lors de la création de ce site de pré-production, pour le protéger des visites de robots motorisés. Cette semaine, nous examinons ce qu’il faut faire s’il n’a pas été mis en place initialement et que le site de staging se retrouve dans les SERP. Quels sont les « conseils vitaux » pour désindexer proprement ce site des moteurs (et éviter que cela se reproduise) ?

Vous en saurez donc plus en regardant cette vidéo numéro 230 :

Bonjour, mon site de préprod est indexé, que dois-je faire ? (Partie 2) Vidéo 230 proposée par Olivier Andrieu (Abondance). Source : Abondance

  Transcript de la vidéo SEO 230 : « Oops, mon site de préprod est indexé, comment faire ? (2e partie) » :

« Bonjour et bienvenue sur cette vidéo d’Abondance numéro 230, qui est donc la suite de la 229 et qui traitera du sujet de l’indexation des sites en pré-production. Ainsi, dans la vidéo de la semaine dernière, j’ai expliqué ce que vous devez faire pour empêcher l’indexation de votre site de pré-production. Cette semaine nous verrons ce qu’il faut faire quand malheureusement on ne l’a pas fait correctement, il y a eu une erreur ou un problème humain, etc. Bref, le site de préprod a été indexé. Comment désindexer ?

Cela prend plusieurs étapes : la première étape consiste à supprimer tous les obstacles dans le site de pré-production, car vous devrez faire une opération de porte ouverte pour les robots moteurs, alors créez un fichier robots.txt qui le fournit. l’accès aux bots, une éventuelle liste blanche ou la suppression des mots de passe, tout ce que nous avons vu la semaine dernière. Alors Étape 1 : Nous allons ouvrir le site aux moteurs cette fois.

À Lire  Elle donne des coups de poing et de pied à son mari puis essaie de le frapper dans la voiture

Étape 2 : Nous mettrons toutes les pages en noindex, pour les pages HTML avec la balise meta robots noindex, pour les fichiers PDF ou avec la directive X-robots-tag du protocole HTTP, voir également la vidéo de la semaine dernière. . Nous mettons tout dans Noindex.

Étape 3 : Nous allons accéder à la Search Console, donc s’il y a une propriété Search Console déjà créée pour le site de pré-production, c’est parfait sinon nous devons la créer et attendre que les données arrivent – nous devrons attendez quelques jours – puis toutes les URL dont nous demanderons la suppression : nous cliquerons donc sur Nouvelle demande dans l’option Suppressions, puis nous choisirons l’option « Supprimer avec ce préfixe pour supprimer toutes les URL » et nous mettrons donc l’adresse . page d’accueil du site de pré-production. Cela supprimera et désindexera toutes les pages du site de pré-production. C’est pourquoi nous avons ouvert le site aux robots afin qu’ils puissent rechercher toutes les pages et les désindexer.

Étape 4 : Attendez que la suppression prenne effet. C’est souvent assez rapide, vous pouvez demander « site:preprod.example.fr » dans tous les cas avec l’adresse de votre site préprod ou aller dans Pages dans Search Console et attendre qu’il y ait 0 pages. dans la table des matières Attention car les pages ont été désindexées mais la Search Console n’a pas été mise à jour ; par conséquent, il peut y avoir un léger délai entre le moment où la désindexation a lieu et le moment où la page Search Console est mise à jour pour la création de rapports. Cela peut prendre de 1 à 3 jours, parfois un peu plus, finalement, ce n’est jamais très facile à gérer dans la Search Console.

Étape 5 : Après avoir vérifié que tout est désindexé et que tout va bien, vous remettez le verrou que vous aviez mis auparavant, donc un robots.txt Disallow:/whitelist, passwords est tout ce que nous avons finalement vu. par semaine, en effet maintenant que la situation est clarifiée, tout est désindexé, et désormais il est interdit aux robots de revenir sur le site de pré-production.

De plus, cela ne fonctionne que pour les sites de pré-production, nous pouvons le faire sur les sites qui apparaîtraient dans la Search Console avec le message « Indexé même si les fichiers Robots.txt sont bloqués », ceci est un message. parfois cela se produit dans la Search Console, et vous pouvez faire cette séquence d’actions sur les pages qui s’affichent avec ce message d’erreur dans la Search Console, cela fonctionnera aussi !

Voilà pour cette vidéo #230, si vous avez eu une bonne désindexation de votre site de pré-production et bien sûr des petites vidéos de révision comme d’habitude – encore une fois j’ai beaucoup parlé de désindexation dans mes vidéos – mais voici une petite échantillon de ces vidéos. Merci beaucoup, à bientôt pour une nouvelle vidéo d’Abondance et encore merci pour votre fidélité. Merci et au revoir 🙂 »

  Autres vidéos touchant à ce sujet