Date de publication : 13 septembre 2018
Temps de lecture : 5 min.
Niveau : Débutant
Définition : Un sitemap est un fichier listant les URLs du site que l’on souhaite faire crawler. Ce fichier XML peut être déclaré aux moteurs de recherche dans le robots.txt et/ou Google Search Console.
Fichier indispensable pour votre référencement naturel (SEO), le sitemap XML est introduit par Google en 2005, les autres grands moteurs de recherche, Yahoo et Bing, le prendront aussi en compte dès l’année suivante.
Il est important de bien comprendre que le sitemap XML est différent du plan de site HTML. Le sitemap XML est destiné uniquement aux robots des moteurs de recherche, avec son encodage spécial.
On parle souvent du sitemap XML et du robots.txt comme deux fichiers complémentaire et pourtant très différents. En effet, le sitemap XML donne des protocoles d’inclusion d’URLs, c’est-à-dire qu’il se charge de guider les moteurs de recherche en leur précisant ce qu’ils doivent crawler.
Le fichier robots.txt quant à lui, se charge de donner des protocoles d’exclusion, indiquant ainsi aux moteurs de recherche ce qu’il ne faut pas crawler. De plus, il est important de rappeler que ce fichier ne garantit pas une indexation des URLs qui y sont soumises.
Enfin, il est de bon ton de rappeler que ne pas avoir de sitemap XML sur son site n’est pas pénalisant, cependant il est fortement recommandé d’en créer un pour fluidifier et améliorer son SEO.
Vous l’aurez compris le sitemap XML permet donc de donner aux robots des moteurs de recherche une liste d’URLs à crawler (et donc à indexer).
Dans cette optique, le sitemap XML peut être particulièrement utile dans plusieurs cas, dont les suivants :
À lire aussi :
Position Zéro : à la conquête du Graal SEO !
En plus de la liste des url d’un site à crawler, le fichier sitemap permet d’enrichir la liste avec des meta-données et de fournir des informations complémentaires aux robots des moteurs de recherche telles que :
Cependant, il est important de noter que le support Google indique que « Google does not currently consume the <priority> attribute in sitemaps. ». Il n’est donc pas prioritaire de renseigner cet élément.
Exemple:
Il existe différents types de sitemaps XML. Le plus classique permet de déclarer des pages, des URLs, mais il est aussi possible de déclarer des images, des vidéos, ou même des news. La forme et le contenu du sitemap XML changent alors légèrement puisque ce ne sont pas exactement les mêmes meta-données indiquées aux robots des moteurs de recherche.
Source : https://support.google.com/webmasters/answer/178636
Enfin, il est possible d’utiliser un sitemap XML pour signaler les différentes versions localisées de vos pages. En clair, plutôt que d’utiliser les balises hreflang sur l’ensemble d’un site, il est tout à fait possible de faire ces déclarations dans un fichier sitemap XML. Cette méthode est d’ailleurs souvent plus simple à mettre en place que les balises hreflang qui demande des développements longs et coûteux.
Les fichiers sitemap XML ne doivent pas dépasser les 50 000 URLs ou les 50 Mo (sitemaps non compressés). Si vous avez un fichier plus volumineux ou un nombre d’URLs plus élevé, il faudra alors scinder votre liste en plusieurs sitemaps. Dans ce cas nous vous recommandons alors de créer un fichier d’index de sitemaps, qui répertoriera l’ensemble des sitemaps XML de votre site.
Idéalement vos sitemaps XML sont générés automatiquement par le CMS qui est utilisé, et mis à jour de façon dynamique. Dès qu’une page est ajouté ou supprimé de l’arborescence de votre site, les sitemaps XML doivent être mis à jour afin de ne pas comporter d’erreurs. C’est la raison pour laquelle il est plus intéressant de privilégier un sitemap XML dynamique.
Néanmoins, il reste envisageable de créer un sitemap à la main depuis un fichier texte avec des balises XML. Cela demandera plus de rigueur pour la mise à jour à chaque publication ou dé-publication de pages mais ne posera aucun problème à la compréhension de celui-ci par les moteurs.
Nous avons vu plus haut dans cet article que le sitemap pouvait être utile pour que les robots des moteurs de recherche crawl facilement les pages profondes ou difficilement accessibles. Attention cependant, celui-ci ne sert pas à pallier une arborescence mal travaillée. Le sitemap ne permettra pas d’améliorer cette situation en termes de crawl. Ce fichier n’est pas là pour corriger les diverses erreurs de conception.
Il en est de même avec les pages orphelines. Si votre site a des pages orphelines, ce n’est pas en les mettant simplement dans un fichier XML que le problème sera résolu. Dans ce genre de cas, il est plus efficace de corriger la navigation pour inclure ces pages isolées dans votre navigation naturelle.
Vous souhaitez en savoir plus sur les fichiers Sitemap XML ? Recevoir une formation ? Ou tout simplement en savoir plus sur le SEO ? N’hésitez pas à prendre contact avec notre équipe d’experts SEO qui saura répondre à vos besoins !
Toute l'équipe SLAP digital se tient à votre disposition pour vous accompagner dans l'optimisation de votre fichier Sitemap XML et de votre référencement naturel
Découvrez nos prestationsDécouvrez nos livres blancs spécialisés sur les divers thèmes du marketing digital et téléchargez les gratuitement.
Nos livres blancsBesoin d'un coup de main ?
Vous souhaitez nous faire part de vos projets ou de vos besoins d’accompagnement ?
N’hésitez pas à nous contacter par téléphone au 01 85 08 03 49 ou à remplir le formulaire. Nous vous contacterons rapidement pour en savoir plus. Venez nous challenger, nous en ferons autant !
Contactez-nous