Optimisation des URL pour le référencement

Que faut-il savoir au sujet de l’optimisation des URL pour le référencement ? Cet article liste tous les éléments à connaître avec plein de conseils issus de 20 ans d’expérience en SEO…

Le format des URL

Avant tout chose, assurez-vous d’avoir lu le guide complet de la syntaxe des URL (sous-domaine, nom de domaine, extension, répertoires, etc.).

La stabilité des URL, critère le plus important

N’allez pas modifier l’URL de vos pages uniquement pour y rajouter des mots-clés surtout si votre référencement fonctionne déjà bien comme ça. Pour des nouvelles rubriques de votre site ou pour un nouveau site, intégrez des mots-clés dès le début. Pour un site ancien, attendez le jour où vous aurez besoin de faire une refonte importante pour intégrer ce genre d’optimisation.

Partagez l’info à vos abonnés Twitter :

Référencement : le + important pour une URL, c’est sa stabilité, + que la présence de mots-clés CLICK TO TWEET

Envie d’améliorer votre référencement sous l’angle technique ?Livre Techniques de référencement webJe vous recommande le livre Techniques de référencement webrédigé par Alexandra Martin et Mathieu Chartier. Connaissant les 2 auteurs et ayant lu ce livre (3ème édition), je sais qu’il vous sera d’une grande aide. Il rentre dans les détails (+ de 500 pages) et fournit de nombreux exemples de code, d’API ou d’outils à utiliser pour optimiser votre référencement.

Présence de mot-clé dans l’URL

D’abord, je préfère être clair : l’URL est loin d’être le principal élément permettant d’optimiser le référencement d’une page. Avant de vous demander s’il faut mettre des mot-clés dans les URL, intégrez-les dans votre contenu, votre balise titre (et votre description).

Il est préférable d’utiliser des mots-clés stratégiques dans les URL, plutôt que des nombres ou des éléments dénués de sens. En effet, comme je l’avais montré dans un test publié sur WRIles moteurs tiennent compte de la présence de mots-clés dans les URL. Par contre, ne vous attendez pas à des miracles avec cette optimisation, ce critère étant peu pris en compte. En résumé : si vous le pouvez (aidez-vous de la réécriture d’URL), utilisez des mots ayant du sens dans vos URL.

Tant qu’à faire, évitez d’utiliser dans ces URL certains mots apportant trop peu de sens (les articles par exemple). Mais dans certains cas il est nécessaire d’en garder (soit parce qu’ils sont importants en terme de référencement comme dans La Rochelle ou l’article La est important, soit pour rendre l’URL compréhensible).

Reprise de l’arborescence dans l’URL

Je vois encore beaucoup de monde qui s’imagine qu’il est préférable de faire apparaître l’arborescence des contenus dans l’URL. Je vais prendre l’exemple que je présente souvent en formation : des sites ecommerce qui vendent des barbecues.

La méthode traditionnelle est de reprendre l’arborescence du catalogue dans l’URL, similaire au fil d’ariane :

/nos-produits/jardin/barbecue-plancha-et-cuisine-exterieur/barbecue/barbecue-a-charbon-de-bois-1233.html

D’autres ont une approche bien plus simple : uniquement la catégorie, rien qui fasse référence au reste de la hiérarchisation des contenus dans le site :

/barbecue-charbon-3060

Voici les inconvénients du 1er exemple :

  • si jamais on veut présenter la catégorie « Barbecue au charbon de bois » également dans une autre catégorie (par exemple fête des pères, ou n’importe quelle autre), on se trouve confronté aux problèmes de contenus dupliqués internes. Certes on peut les régler avec des canoniques ou autres astuces, mais ça complique pour rien.
  • si jamais on veut renommer une catégorie mère, ou en fusionner plusieurs, ou en scinder en plusieurs, alors ça « casse » les URL de nombreuses catégories et sous-catégories. Même en faisant tout ce qu’il faut (mise à jour de liens internes et externes, redirections 301) c’est pas terrible pour le SEO.
  • un peu trop longue, ça peut compliquer les choses (mais pas forcément le référencement naturel)

Le second exemple est bien mieux, il n’a aucun des inconvénients que je viens de citer. Par contre, surtout pour des gros sites, ça pourrait servir d’avoir un répertoire à la racine pour repérer facilement qu’il s’agit d’une page de type « catégorie ».

Remarque : le format de l’URL n’a pas de rapport avec la compréhension par Google de votre fil d’ariane. Un site utilisant le second exemple peut bénéficier d’un affichage « en mode fil d’ariane » dans les SERP :

Format URL et fil ariane SERP

Dans les SERP, Google affiche parfois un fil d’ariane au lieu de l’URL d’un résultat

Dans ma capture d’écran, les 3 résultats qui bénéficient de l’affichage du fil d’ariane dans les SERP n’ont pas choisi le même format d’URL : seul le 3ème a évité de reprendre l’arbo dans l’URL. Et le 4ème, qui inclut l’arborescence dans l’URL, n’a pas de fil d’ariane dans les SERP.

Notez que si vous souhaitez bien faire comprendre à Google le fil d’ariane, mieux vaut utiliser des données structurées (par exemple via schema.org).

Séparateurs de mots dans les URL

Pour séparer correctement les mots dans les URL, il faut utiliser des caractères interprétés comme des séparateurs par les moteurs de recherche. Je vous conseille de rester le plus simple possible et d’utiliser principalement le tiret (« tiret du 6 ») et le point par exemple.

D’autres caractères fonctionnent en tant que séparateur, mais tenez compte des remarques suivantes :

  • la virgule : un jour ou l’autre, vous aurez des problèmes car elle aura été mal interprétée. Egalement, vous aurez des soucis quand vous traiterez un fichier CSV contenant vos URL et d’autres données séparées par une virgule (c’est le cas d’un export des backlinks dans Bing Webmaster Tools).
  • le point-virgule (;) : vous risquez d’avoir les mêmes problèmes qu’avec la virgule alors autant éviter
  • la barre en biais (/ ou « slash ») ne pose pas vraiment de problème, à condition de faire attention à la notion de répertoire virtuel : pensez-y dans votre code HTML, quand vous faites référence à des fichiers (scripts, images) ou des liens.
  • la barre verticale (| ou « pipe ») : à éviter car trop compliquée ! elle est très dure à taper au clavier et pas simple à expliquer à l’oral
  • le signe pourcent (%) , l’astérisque (*) ou l’arobase (@) : pourquoi pas, mais autant rester simple non ?

N’utilisez pas le tiret bas (underscore : _ ou « tiret du 8 ») car il n’est pas reconnu comme un séparateur (même si en voyant les SERP vous en avez l’impression).

Le tiret bas (underscore) n’est toujours pas un séparateur pour Google : à éviter dans les URLCLICK TO TWEETN’utilisez pas le signe égal (=) et l’esperluette (&) qui sont plutôt à réserver aux URL dynamiques.

Ne vous fiez pas à la mise en gras de certains mots ou expressions dans les pages de résultats de Google, la gestion de l’affichage des résultats et l’algorithme de classement des résultats sont deux processus distincts. A une époque (vers 2006), Bing (MSNSearch à l’époque) indexait rarement les pages dont l’URL comportait plus de 2 tirets. La situation semble s’être améliorée depuis.

Paramètres d’URL

Si vous avez des URL dynamiques et que vous n’utilisez pas la réécriture d’URL, il est probable que vos URL contiennent ce qu’on appelle des « paramètres ». Il s’agit de variables passées dans l’URL, comme par exemple le paramètre « page » qui vaut « 3 » dans l’URL fictive https://example.com/articles.php?page=3

Ca ne pose pas forcément de problèmes ! Par contre, dans ce cas, Google vous propose de l’aider à « comprendre » ce qu’il doit en faire. Pour cela, consultez mon tuto sur le réglage des paramètres d’URL dans Search Console.

Longueur de l’URL

La longueur n’est pas un problème pour les moteurs, qui indexent des URL très longues. Par contre, ce n’est pas très pratique à exploiter, par exemple quand une URL est copiée dans un forum ou un blog, elle est souvent tronquée pour éviter de déformer l’affichage. Dans ce cas, les éventuels mots-clés qui la composent risquent de ne pas apparaître.

Je suis donc plutôt enclin à vous conseiller de créer des URL assez courtes.

Envie d’en savoir plus à ce sujet ?Longueur d’URL pour le SEO

La date dans l’URL

Faut-il mettre la date dans l’URL de ses articles ?

En général je déconseille de faire apparaître la date dans l’URL, car ça n’est pas indispensable et ça génère des problèmes quand on met à jour l’article. De nombreux blogs ont des URL avec la date comme /blog/2015/09/ici-le-titre mais :

  • quand vous mettrez à jour l’article en modifiant la date, l’URL sera cassée : il faudra prévoir des redirections, vous perdrez les partages sur les réseaux sociaux, etc.
  • quand un internaute voit l’URL dans les résultats (ça peut arriver), il peut décider de ne pas cliquer, pensant que l’article est dépassé, même si ce n’est pas forcément le cas

Demandez l’avis de vos followers Twitter :

D’un point de vue SEO, faut-il inclure la date dans l’URL ? L’avis de WebRankInfo ici :CLICK TO TWEET

Le signe # dans les URL

Dans une URL, ce qui suit le signe # correspond traditionnellement à une ancre nommée, c’est-à-dire un signet interne à la page. On parle aussi parfois de « fragment ». Cela permet de faire un lien vers une partie d’une page. Par exemple voici un lien vers la rubrique du signe # pour les URL.

Certaines technos utilisent ce signe d’une autre façon (par exemple #! en ajax).

Soyez simplement conscients que pour les moteurs de recherche, tout ce qui suit le signe # est ignoré. Si des paramètres importants pour l’affichage du contenu sont passés derrière le signe #, cela risque d’être un problème pour votre référencement. Il y a néanmoins maintenant des exceptions avec Google et l’indexation d’Ajax et parfois aussi avec le robot de Google pour mobiles.

Extension : .html ou .htm ou .php ou .aspx ou aucune ?

Quelle extension faut-il utiliser dans les URL ?

Selon moi la réponse est simple : peu importe votre extension de fichier ! Vous n’êtes même pas obligé d’en utiliser (voyez l’exemple de Wikipédia). Ce n’est pas parce que cela se termine par .html qu’il s’agit d’un document HTML. Ce qui compte c’est que votre page soit effectivement codée en HTML (si possible sans trop d’erreurs !).

En choisissant de ne mettre aucune extension à la fin de l’URL, vous vous donnez plus de chances d’avoir une URL stable, quels que soient les CMS que vous utiliserez dans le futur. C’est donc mieux a priori.

Slash en fin d’URL

Faut-il mettre un slash à la fin de l’URL ? Dans tous les cas ou seulement pour certains types de contenus ?

Par exemple, prévoir /blog/ici-le-titre/ au lieu de simplement /blog/ici-le-titre

Certains assurent qu’il faut absolument « fermer » ses URL en ajoutant systématiquement un / à la fin. Vous l’avez compris, je ne suis pas de cet avis (Wikipedia non plus semble-t-il, ça ne les empêche pas de cartonner en SEO…).

Par contre, comme pour le coup des WWW, une fois que vous avez décidé si vous mettez des slashes ou pas en fin d’URL, il faut vous y tenir. Redirigez les mauvaises URL vers les URL officielles.

Si c’est plus simple de toujours ajouter un / en fin d’URL, ça ne pose aucun souci.

Au fait, à part les URL, que faire en SEO ?Suivez ma méthode en 5 étapes !

URL multiples

Si une page est accessible à deux URL (ou plus), il y a un risque de contenu dupliqué(duplicate content). Si un même contenu est accessible à plusieurs endroits, les moteurs de recherche tentent de déterminer ce qu’on appelle l’URL canonique, c’est-à-dire l’URL de la page la plus légitime (par exemple celle qui reçoit le plus de liens). Ils n’indexent alors que cette URL canonique, et n’indexent pas les autres (par exemple, Google a amélioré son algorithme à ce sujet à l’époque de la mise en place de BigDaddy). Le problème est qu’il est difficile de prévoir quelle URL va être retenue par les moteurs.

Par ailleurs, avoir une page accessible à plusieurs URL est mauvais également en terme de stratégies de liens, puisque l’optimisation s’éparpille sur plusieurs URL plutôt que de se concentrer sur une seule. Voilà pourquoi il faut faire attention de ne pas avoir d’URL multiples pour une page donnée.

A ce propos, comme l’indique SuperPJ dans les commentaires, si on utilise l’URL Rewriting, il ne faut pas oublier de désindexer les pages dynamiques ayant l’ancien format d’URL. Pour cela, le mieux est de rediriger de façon permanente (code HTTP 301) chaque ancienne URL vers la nouvelle équivalente. Si ce n’est pas possible, utilisez la balise URL canonique ou le fichier robots.txt. Dans le cas contraire, une même page sera accessible sur 2 URL ce qui posera des problèmes de duplicate content.

Accents, lettres diacritiques et autres caractères spéciaux

Même si des moteurs comme Google gèrent généralement bien les caractères spéciaux dans les URL, je vous déconseille d’en utiliser. Remplacez-les par leur équivalent non accentué, ça vous évitera bien des soucis.

Ceci concerne les parenthèses, accolades, apostrophe, guillemets, etc. ainsi que l’espace et les lettres diacritiques (accents).

Prenons l’exemple d’une page de Wikipédia avec un accent, par exemple /wiki/Numérique. Même si certains navigateurs l’affichent avec l’accent, la véritable URL encode les caractères spéciaux. Par exemple, é devient %C3%A9 si bien que mon exemple donne /wiki/Num%C3%A9rique

D’une part, vous perdez des mots-clés dans les URL (OK, ce n’est pas si grave que ça). D’autre part, cette URL devient « compliquée » et sera un jour ou l’autre mal interprétée. Par exemple, le signe % sera à nouveau encodé, ou des espaces s’ajouteront.

En résumé : même si cela ne pose aucun réel problème en théorie, l’utilisation de caractères spéciaux (lettres accentuées par exemple) apporte trop de problèmes.

Mieux vaut les remplacer par un équivalent standard (une lettre accentuée par sa version non accentuée, un espace par un tiret, etc.).

Partagez ça sur Twitter :

Est-ce une bonne idée pour le référencement d’utiliser dans l’URL des lettres accentuées et autres caractères spéciaux ? La réponse ici de WebRankInfoCLICK TO TWEET

Majuscules

Certains utilisent des majuscules dans les URL (souvent avec des technos Microsoft, je ne sais pas pourquoi). Là encore, à quoi bon utiliser des majuscules ? Que se passe-t-il si quelqu’un cherche à accéder à l’URL sans la majuscule que vous aviez prévue ? Parfois ça génère une erreur, parfois ça renvoie le même contenu que l’URL avec la majuscule (mais cela ne génère-t-il pas des contenus dupliqués ?), parfois il faut prévoir une redirection 301 vers la version avec majuscule.

Les majuscules dans les URL n’apportent r