Sitemap

Un sitemap est un fichier qui liste les pages d'un site pour faciliter leur indexation par Google. Types, bonnes pratiques et comment le configurer sur Webflow.

Ce qu'est un sitemap

Un sitemap, ou plan du site en français, est un fichier qui répertorie les URLs d'un site web pour faciliter leur découverte et leur indexation par les moteurs de recherche. C'est un document de communication entre le propriétaire du site et les robots des moteurs de recherche : il leur dit quelles pages existent, quelle est leur importance relative et à quelle fréquence elles sont mises à jour.

Il existe deux types de sitemaps avec des objectifs et des audiences distincts. Le sitemap XML est destiné aux moteurs de recherche. Le sitemap HTML est destiné aux visiteurs humains.

Le sitemap XML est celui qui a un impact SEO direct. Il ne remplace pas un bon maillage interne ni une architecture de site cohérente, mais il complète ces éléments en garantissant que toutes les pages importantes sont connues de Google, même celles qui sont difficiles à atteindre via les liens internes du site. C'est particulièrement utile pour les sites avec un grand nombre de pages, les nouveaux sites qui n'ont pas encore de liens entrants externes, et les sites dont certaines pages sont peu linkées en interne.

Le sitemap XML

Sa structure. Un sitemap XML est un fichier texte au format XML qui liste les URLs du site avec quelques métadonnées optionnelles pour chacune : la date de dernière modification (lastmod), la fréquence de changement estimée (changefreq) et la priorité relative de la page par rapport aux autres pages du site (priority). Ces trois métadonnées sont optionnelles et souvent ignorées par Google, qui se fie davantage à ses propres observations du site qu'aux indications du propriétaire.

L'élément le plus important du sitemap XML est simplement la liste des URLs. Google l'utilise principalement comme signal de découverte : "voici les pages que je voudrais que tu explores". Il ne garantit pas l'indexation de chaque URL listée, mais facilite leur découverte.

Sa taille. Un sitemap XML standard peut contenir jusqu'à 50 000 URLs et peser jusqu'à 50 Mo. Pour les sites avec plus de 50 000 pages, plusieurs fichiers sitemap peuvent être créés et référencés dans un fichier index de sitemaps. Les grandes plateformes e-commerce ou les sites de presse avec des dizaines de milliers de pages utilisent systématiquement cette structure multi-sitemap.

Sa soumission à Google. Le sitemap XML doit être déclaré à Google via deux canaux : dans le fichier robots.txt (en ajoutant une ligne Sitemap: https://mondomaine.fr/sitemap.xml) et dans Google Search Console (section Sitemaps). La soumission dans Search Console permet de suivre le statut d'indexation des URLs listées et de détecter les erreurs.

Ce que le sitemap doit et ne doit pas contenir

Un sitemap efficace liste uniquement les pages que vous voulez voir indexées par Google. C'est une erreur fréquente de laisser le sitemap lister automatiquement toutes les URLs du site sans filtrage.

À inclure dans le sitemap :
Les pages importantes pour le SEO : pages de service, pages produit, articles de blog, pages de catégorie, pages de destination. Les pages de contenu éditorial qui méritent d'être indexées et positionnées.

À exclure du sitemap :
Les pages avec une directive noindex (les inclure dans le sitemap crée une contradiction que Google signale dans Search Console). Les pages d'administration et de connexion. Les pages de confirmation de commande ou de formulaire soumis. Les pages de pagination (la page 2, page 3 d'un blog par exemple), qui peuvent être exclues selon la stratégie d'indexation choisie. Les pages avec du contenu dupliqué. Les URLs avec des paramètres techniques (?utm_source=newsletter, ?sort=price).

Les différents types de sitemaps XML

Le sitemap standard. C'est le format de base qui liste les URLs de toutes les pages du site. Il est suffisant pour la plupart des projets.

Le sitemap d'images. Il référence spécifiquement les images du site avec leurs URLs, titres et légendes. Il facilite l'indexation des images dans Google Images et peut être pertinent pour les sites dont les images sont des contenus importants (photographie, e-commerce avec des visuels produit soignés).

Le sitemap de vidéos. Il référence les vidéos hébergées ou intégrées sur le site avec leurs métadonnées (titre, description, durée, miniature). Il facilite l'apparition dans les résultats vidéo de Google.

Le sitemap d'actualités. Il est spécifique aux sites d'information qui souhaitent voir leurs articles récents indexés rapidement dans Google News. Il ne liste que les articles publiés dans les 48 dernières heures et est soumis à des critères d'éligibilité spécifiques.

Le sitemap HTML

Le sitemap HTML est une page du site qui présente la liste des pages importantes dans une structure lisible par les visiteurs humains. Son utilité principale est ergonomique : il permet aux visiteurs qui ne trouvent pas une page via la navigation principale de la chercher dans une vue d'ensemble structurée.

Son impact SEO est secondaire par rapport au sitemap XML. Il contribue marginalement au maillage interne en créant des liens vers toutes les pages listées, mais il n'est pas un outil d'indexation au sens technique du terme. Pour les petits sites avec une navigation claire, il est souvent superflu. Pour les sites avec beaucoup de pages et une architecture complexe, il peut améliorer l'expérience utilisateur.

Sitemap et Webflow

Webflow génère automatiquement un sitemap XML pour tous les sites publiés avec un domaine personnalisé. Ce sitemap est accessible à l'URL https://mondomaine.fr/sitemap.xml et est mis à jour automatiquement quand des pages sont ajoutées, modifiées ou supprimées.

Par défaut, Webflow inclut dans le sitemap toutes les pages et items CMS qui ne sont pas marqués comme noindex dans leurs paramètres SEO. La gestion des exclusions se fait donc page par page dans les paramètres SEO de chaque page ou au niveau de la collection CMS pour les items à exclure globalement.

Webflow déclare automatiquement le sitemap dans le fichier robots.txt du site. La soumission manuelle dans Google Search Console reste recommandée pour accélérer la découverte des nouvelles pages et suivre les erreurs d'indexation.

FAQ

Un sitemap est-il obligatoire pour être indexé par Google ?

Non. Google peut découvrir et indexer les pages d'un site via les liens internes et les liens externes, sans avoir besoin d'un sitemap. Cependant, un sitemap accélère la découverte des nouvelles pages et garantit que toutes les pages importantes sont connues de Google, même celles qui sont peu linkées. C'est une bonne pratique SEO systématique qui ne coûte rien à mettre en place sur des plateformes comme Webflow qui le génèrent automatiquement.

Faut-il mettre à jour le sitemap manuellement à chaque nouvelle page ?

Sur Webflow et la plupart des CMS modernes, le sitemap est mis à jour automatiquement. Sur des sites développés sur mesure, une mise à jour dynamique du sitemap doit être implémentée dans le code pour qu'il reste synchronisé avec les pages réelles du site.

Pourquoi Google n'indexe-t-il pas toutes les URLs de mon sitemap ?

Google décide souverainement quelles pages indexer, indépendamment du sitemap. Il peut choisir de ne pas indexer une page si son contenu est jugé insuffisant, dupliqué, peu utile ou si sa qualité ne répond pas aux standards de l'index. Le sitemap est un signal de découverte, pas une garantie d'indexation. Les URLs listées dans le sitemap qui ne sont pas indexées sont signalées dans Google Search Console avec les raisons identifiées.

Un sitemap peut-il nuire au SEO ?

Non en lui-même. En revanche, un sitemap mal configuré, qui liste des pages noindex ou des URLs redirigées, crée des incohérences que Google signale dans Search Console. Ces incohérences ne pénalisent pas directement le classement mais indiquent que la configuration du site mérite d'être revue.

Définitions similaires

photo d'anaïs bironneau associée et co-gérante de l'agence studio seja
Anaïs Bironneau
co-fondatrice & responsable éditoriale
Co-fondatrice de Studio Seja, agence web strasbourgeoise spécialisée en développement sur mesure, création de sites et stratégie digitale. Elle pilote les projets clients et rédige les contenus de l'agence et parfois des écosystèmes partenaires.
votre projet commence ici

Quatre étapes pour passer de l'idée au produit,
sans improvisation.

De la stratégie à la mise en production, nous pilotons chaque étape avec rigueur et transparence. Un seul objectif : livrer un produit qui performe.

parlons de votre projet
logo de studio seja