Tutoweb

Meta-données

Les metas-données sont des informations contenues dans le head de chaque page. Elles ne sont pas visibles dans la page et sont destinées au serveur web, aux navigateurs et aux moteurs de recherche. Chaque information est identifiée par un nom et un contenu. Le nom de l'information est défini dans les attributs name ou http-equiv, et la valeur associée est contenue dans l'attribut content.

Déclaration du document

Content-Type

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
  4. </head>

Elle déclare le type de document (type MIME) et son jeu de caractère utilisé. Dans l'exemple, nous utilisons le type text/html. En XHTML, le type MIME devrait toujours être application/xhtml+xml mais la plupart des navigateurs n'ont pas la moindre idée de ce que c'est. Pour une image JPG, le type MIME est image/jpeg, pour un fichier CSS c'est text/css.

Nous utilisons le jeu de caractères utf-8 plutôt que l'iso-8859-1 propre à la langue française mais limité dans l'affichage des caractères.

Content-Language

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta http-equiv="Content-Language" content="fr" />
  4. </head>

Elle déclare la langue utilisée dans la page. De plus en plus utile maintenant que les moteurs de recherche ont inclus la langue dans leurs critères de recherche. Indispensable également pour les synthétiseurs vocaux destinés aux non-voyants. Si votre site est multilingue, séparé les codes par une virgule.

Référencement

Une question souvent posée concerne la pertinence des meta pour les moteurs de recherche. Il faut bien avouer que les meta ne sont pratiquement plus pris en considération par la plupart des moteurs de recherche. Google par exemple, ne tient compte que de la meta description et la meta robots. Cette situation est la conséquence du référencement abusif depuis 1999 (spamdexing).

En ce qui concerne les annuaires de recherche, les meta-données n'ont aucune influence car le référencement des sites web se fait par intervention humaine. Les personnes responsables de la validation du site ne s'amusent pas à aller fouiner dans le code HTML.

Description

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="description" content="Une phrase avec les mots clés." />
  4. </head>

La meta description est très importante pour le créateur de site car son incorporation dans un document sert à l'indexation des pages web par les moteurs de recherche et les annuaires. Elle doit contenir une description concise du contenu de la page en une ou deux phrases (sujet + verbe + complément); c'est-à-dire 200 caractères maximum (espace compris).

Il est fortement recommandé d'utiliser cet élément car si vous ne donnez pas vous-même une description de la page, les moteurs de recherche utilisent les premières lignes de votre page qui ne sont pas nécessairement les plus explicites. Soyez le plus objectif et évitez les messages commerciaux ou trop racoleurs.

Keywords

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="keywords" content="tuto, tutorial, tutoriaux, tutorials, tutoriel, tutoriels, didacticiel, didacticiels, web, internet />
  4. </head>

Tout comme la précédent, la meta keywords est indispensable. Elle contient une série de mots-clé séparés par une virgule. Évitez l'utilisation des capitales, insérez les termes sans accents et avec une accentuation codée (elephant, &eacute;l&eacute;phant), ajoutez les formes au féminin et au pluriel si elles existent ainsi que les mots mal orthographiés qu'un internaute pourrait taper dans un moteur de recherche. Ne dépassez pas 100 mots clés représentatifs du contenu de la page sous peine d'être mis sur une liste noire.

Robots

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="robots" content="index, follow" />
  4. </head>

Cette valeur permet de donner des directives aux robots des moteurs de recherche. En fonction de la valeur de l'attribut content, vous pouvez choisir la manière dont vos pages seront indexées. Cette meta n'est pas nécessaire si vous mettez en place un fichier robots.txt.

La valeur content="none" ou "noindex" empêche l'indexation, contrairement à "all" par défaut. La valeur content="index" autorise l'indexation de la page. La valeur conte="follow" autorise l'indexation simultanée de la page et des pages qui sont les cibles des liens contenus dans cette page.

Revisit-after

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="revisit-after" content="15 days" />
  4. </head>


Indique aux robots de moteur de recherche la périodicité des passages du robot sur le site. Cette meta est utilisée pour les sites dont le contenu évolue régulièrement. Beaucoup de moteurs ne l'emploient pas. Les valeurs (jours) sont mentionnées en anglais.

Refresh

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="refresh" content="10; http://www.monsite.com/" />
  4. </head>

La valeur content est exprimé en secondes et force le navigateur à recharger la page toutes les N secondes. Cette meta est utilisée pour un site aux informations renouvelées très fréquemment, par exemple un site de cotation boursière. Elle peut servir également à la redirection automatique du visiteur.

Attention
Les redirections avec un délais très court (entre 0 et quelques secondes) sont souvent associés à du spam et votre site risque d'être pénalisé. Ceci est valable pour les moteurs de recherche et certains annuaires. Mieux vaut les éviter.

Divers

Author

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="author" content="Jean-Pierre Dupont" />
  4. </head>

Indique le nom de l'auteur sans pour autant créer un copyright. Cette meta intéressera plutôt le visiteur curieux que les moteurs de recherche.

Generator

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="generator" content="Macromedia Dreamweaver MX" />
  4. </head>

Aucune influence, ni pour les moteurs de recherche, ni pour le navigateur utilisé. Cette information intéresse cependant les responsables marketing des sociétés proposant des éditeurs HTML pour calculer la part de marché de leur produit.

Identifier-url

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="identifier-url" content="http://www.monsite.com/" />
  4. </head>

Il est parfois utile de rappeler l'adresse de la page d'accueil de votre site pour ceux qui y sont entrés par une des pages de celui-ci.

Reply-to

  1. <head>
  2. <title>Titre de la page</title>
  3. <meta name="reply-to" content="jp_dupont@mail.com" />
  4. </head>

Cette meta permet à l'internaute averti de connaître votre adresse e-mail si elle n'apparaît pas sur la page qu'il consulte. Notons qu'il est assez farfelu de penser que le webmaster indique son adresse électronique dans une meta et pas dans sa page web. D'autre part, le pourcentage des personnes qui consultent le code source est minime.

Remarques

Cette liste est loin d'être exhaustive. On est parfois bien étonné de voir sur certains sites une liste interminable de meta. Actuellement, aucun standard n'a été établi par le W3C.

 

Réalisé le 26 mars 2006.
Haut de la page