Actualités

Conseils sites internet

Retour à la liste >
< Voir toutes les actualités de ce thème
22
avr.

Google et la balise canonical

par Iannis COUTY

Les balises « Canonical »

Cela remonte à février 2009, lorsque les 3 grands moteurs de recherche que sont Yahoo, Bing et Google, se sont mis d’accord pour créer une nouvelle balise « html » nommée « rel=canonical ».

L’objectif de cette balise est de permettre de lutter contre le « duplicate content » à l’intérieur d’un même site. L’intérêt de cette balise au préalable était de différencier (sur un même site), un contenu « canonique », c'est-à-dire original, de plusieurs contenus dupliqués. La balise à insérer dans les pages dupliquées se définit ainsi : « <link rel="canonical" href="URL-de-la-page-canonique" />.

Dorénavant cette fonctionnalité existe également pour les pages issues de sites différents.

Source : Google

La « checklist » de mise en place

Voici les conseils : pour la mise en place de cette balise au sein d’une page dupliquée ou dont le contenu est très proche d’une page dite « canonique ».

  1. Assurez-vous à 2 fois que L’URL « canonique » que vous indiquez dans la balise, existe bel et bien et n’est pas redirigée vers une erreur 404.
  2. Assurez-vous que la page canonique ne contient pas de balise « <META NAME="robots" CONTENT="noindex"> ». Cette balise indique aux moteurs de ne pas indexer la page.
  3. Assurez vous que la page canonique est bien celle que vous désirez voir apparaitre dans le résultat des moteurs, et non une des pages duppliquée.
  4. Très intéressant, vous pouvez choisir de positionner la balise soit dans la partie « Head » du code source de la page, mais également dans l’en-tête http. Cela a un gros avantage, pour cela, reprenons l’exemple fourni par Google. Imaginez que vous ayez un contenu « pdf » accessible en ligne (donc avec une adresse URL), et reprenant le contenu spécifique d’une page web. Vous auriez alors des URL du type : http://www.explication.com/contenu1.html, et http://www.explication.com/contenu1.pdf. Vous pourrez alors indiquer que la version « html « est canonique de cette façon :
    GET /contenu1.pdf HTTP/1.1
    Host: www.explication.com
    (...rest of HTTP request headers...)
    HTTP/1.1 200 OK
    Content-Type: application/pdf
    Link: <http://www.explication.com/contenu1.html >; rel="canonical"
    Content-Length: 785710
    (... rest of HTTP response headers...)
  5. ATTENTION, il ne faut indiquer qu’1 seule balise “canonical” dans votre page au risque que toutes les balises soient ignorées.

Les 5 erreurs à ne pas commettre

1 - Attention aux pages multiples

Si vous avez du contenu qui se propage à plusieurs pages, ex : « exemple.com/article?story=histoire-du-web&page=1 » et «exemple.com/article?story=histoire-du-web&page=2», etc… Il ne faut pas dans ce cas indiquer la page « 1 » comme canonique car le contenu des pages « 2 », et autres, est différent.

Cela reviendrait à ne pas indexer le contenu des pages suivantes. Dans ce cas, Google recommande de réaliser une version « monopage » de l’article, et de le définir comme la page « canonique », ou bien d’utiliser la pagination avec « rel= « prev » et rel= « next » ».


Source : Google

2 - Attention aux URL relatives et absolues.
Comme la plupart des balises, « Link » accepte des écritures d’URL relatives et absolues (URL complète précédée de http://). Comme l’indique l’image ci-dessous, si vous indiquez le nom de la page avant le « / » (example.com), vous aurez en réalité le lien suivant : « example.com/example.com/cupcake.html », c'est-à-dire une page qui n’existe pas. Il faut donc, soit indiquer une URL absolue, soit indiquer uniquement la page de destination comme suit (dans l’exemple) : « /cupcake.html ».

Source : Google

3 - Faites attention aux déclarations involontaires des « rel=canonical ».
Google a remarqué que beaucoup de déclarations semblent être le fruit d’une erreur. Attention aux fautes de frappe, attention aux copier/coller sans modifier la cible de l’attribut « rel=canonical ». Attention également aux « plugins » SEO qui insèrent souvent par défaut un « rel=canonical », et lorsqu’il y a plusieurs balises, aucune n’est prise en compte et le résultat est à l’eau.

Source : Google


Source : Google


4 - Attention aux balises dans les pages « catégorie ».
Disons que vous exécutez un site sur les desserts. Votre site dessert dispose de pages de catégories utiles comme "pâtisserie" et "glace ». Si le contenu de vos pages « articles » est proche du contenu de vos pages « catégorie », vous pourriez ajouter un « rel = canonical » partir de la page catégorie vers la page « article », ce qui signifierait que la page «catégorie » est duppliquée.

Si tel était le cas, alors votre page « catégorie » ne figurerait pas dans les résultats de recherche des moteurs. C'est parce que « rel = canonical » indique à ces moteurs que vous préférez afficher uniquement l'URL canonique à la place de la page dupliquée. Toutefois, si vous souhaitez que les utilisateurs puissent trouver à la fois la page de catégorie et l'article vedette, il est préférable d'avoir seulement une rel =canonical » sur la page « catégorie »… ou vous pouvez ne rien faire du tout.

Source : Google

5 - Attention à l’implémentation de la balise « canonical » dans le body du code.

Le lien « rel =canocical » ne doit apparaître que dans le <head> de votre document HTML. Pour éviter tout problème d'analyse du code, il est hautement préférable d'inclure l'attribut « rel = canonical » le plus haut possible dans le code. Lorsque la balise est rencontrée dans le <body>, celle-ci est tout simplement ignorée. C'est une erreur très facile à éviter.

Source : Google

Toutes ces indications sont issues du retour d’expériences des équipes de Google, il est donc bon d’en prendre acte.

Source ayant inspiré cet article :

  • http://googlewebmastercentral.blogspot.fr/2013/04/5-common-mistakes-with-relcanonical.html
Actualité précédente Actualité suivante


Suivez Agence Web Conseil sur Facebook !


Notre équipe, en veille technologique permanente, vous informe sur l'actualité des métiers liés au développements de solutions internet : design et tendances, ingénierie de développement, stratégies web marketing et référencement ...

Réagissez en laissant vos avis et commentaires, nous serons ravis de partager avec vous nos expériences  et points de vue !