Référencement

Le classement des recherches

Les critères de pertinence utilisés par les moteurs sont assez complexes et sont d'ailleurs gardés secrets. Chaque moteur utilise ses propres critères, ce qui explique que la réponse obtenue sera différente pour Google, Altavista ou Voila.

L'ensemble des critères forment ce que l'on appelle l'algorithme de classement. Les critères peuvent être classés en 2 grandes catégories: le contenu de la page (meta, titre, premiers mots du body, ...) et la popularité du site (nombre de liens vers le site et le nombre de visiteurs du site). Ceci n'est pas totalement exhaustif. D'autres points, comme le nom de domaine ou l'ancienneté, peuvent aussi influencer le classement.

On peut dire qu'en règle générale, ils se basent d'abord sur la fréquence et la localisation des mots clés. Les pages web dont le nom comporte le mot clé demandé sont supposées se rapporter davantage au sujet. Les moteurs de recherche vont également vérifier si les mots clés apparaissent dans la première partie de la page, c'est-à-dire dans le titre de la page et dans les premiers paragraphes. L'idée de départ est que, si une page est consacrée à un certain thème, ce thème est mentionné dès le début du texte.

La fréquence est également un facteur important dans le classement: les moteurs de recherche analysent le nombre d'occurrences d'un mot clé. Si un mot clé revient de nombreuses fois sur une page, c'est parce que ce mot clé est plus important que les autres. Évidemment, ce critère n'est pas un gage de qualité. A fortiori quand les webmasters tentent d'adapter leur contenu au crawler plutôt qu'au visiteur.

Il est intéressant de s'attarder sur les techniques de Google, n°1 des moteurs de recherche. Ces techniques sont très caricaturées mais c'est pour bien comprendre le principe.

  • Popularité/quantité: nombre de liens qui pointent vers votre site. Pour avoir une idée, tapez link:http://www.mon-site.com Cela fonctionne aussi dans les autres moteurs. On estime qu'un site est "populaire" lorsqu'il est repris par plus de 100 autres sites.
  • Popularité/qualité: Google analyse la popularité du site qui reprend le lien. Si mon voisin a fait une page personnelle et qu'il indique mon lien sur sa page, cela n'aura pas le même impact que si je suis repris sur la première page de Yahoo!
  • Rapport: il doit exister un rapport entre le lien et le site qui le propose. Si un site de cuisine propose le lien du magasin informatique près de chez lui, la valeur de rapprochement est faible.
  • Nombre: un lien enfoui parmi 200 autres liens (pour une page de liens par exemple) a peu de chance d'être bien référencé. Plusieurs fois sur la page est un bon investissement.
  • Position: un lien repris dans un paragraphe à plus d'importance qu'un lien isolé.

Quels sont les moteurs incontournables ?

Si on regarde les baromètres, Google capte 60 % du marché, Yahoo 15 %, sachant que 75 % du trafic sur Yahoo vient de Google. Si on n'a pas beaucoup de temps à consacrer au référencement, on peut se contenter de Google. Avec plus de temps et/ou d'argent, il y a Voila, AOL et MSN qui gagnent du terrain, Altavista, Alltheweb et Nomade. Pas plus de dix moteurs génèrent du trafic. La tendance qui peut être intéressante, ce sont les outils de recherche et les annuaires thématiques. A côté des moteurs, il y a les annuaires, qui historiquement généraient le plus de trafic, mais qui sont en très forte perte de vitesse.

Olivier Andrieu - Abondance.com

Faut-il référencer ma page d'accueil ou toutes mes pages ?

Bien souvent, le référencement de la page d'accueil suffit mais il a été remarqué quelques lacunes à ce niveau. Mieux vaut donc référencer toutes ses pages une par une. Mais attention, les moteurs de recherche se protègent contre le référencement abusif. Pour éviter de voir votre site refusé, inscrivez manuellement une page par jour.

Asutce: pour savoir quelles sont les pages référencées par Google tapez: site:www.monsite.com

Quel est le temps entre l'indexation et le référencement effectif ?

Lorsque le site est inscrit dans les différents moteurs et annuaires (indexation) il faut attendre entre quelques jours et quelques mois (maximum 6) pour être référencé. Tout dépend du moteur ou de l'annuaire. Mais la moyenne semble tourner aux alentours de 6 semaines.

Quid des sites en Flash ?

Depuis le début, les sites conçus avec la technologie Flash ont du mal a être référencés. Ce problème est dû à l'absence de code HTML qui ne permet pas de renseigner les moteurs de recherche sur le contenu.

Depuis quelques temps il semblerait que Google gère les animations Flash à en juger notre recherche. Il répertorie les animations mais peut également déchifrer le contenu à condition qu'il s'agit de texte éditable (possible que dans les dernière versions de Flash). Pour le moment le sujet est assez vague et on ne connaît pas très bien l'efficacité de ce système ni les critères de recherche.

Sites dynamiques

Les sites dynamiques sont reliés à des bases de données. Le nom des pages est généré à la volée. Ces pages sont plus difficiles à référencer car les moteurs ne les indexent pas toujours telles quelles. Ce souci peut être résolu en appliquant des règles d'URL rewriting (ré-écriture des URL).

Peut-on interdire le référencement de certaines pages ?

Puisque les moteurs cherchent sans arrêt les pages présentent sur la toile, on pourrait penser qu'aucune page ne lui échappe. Et bien non ! On vient de voir qu'il était important d'adapter une page HTML pour les sites réalisés entièrement en Flash. Si certaines de vos pages ont un caractère confidentiel, il est facile de demander aux moteurs de ne pas les référencer.

La première possibilité est d'utiliser une balise <meta> avec l'attribut robot. C'est assez contraignant car il faudra l'ajouter sur chaque page.

  1. <head>
  2. <meta="robots" content="index, follow">
  3. </head>

L'autre solution est d'utiliser un fichier texte nommé robots.txt (en minuscules), placé à la racine du serveur. Ce fichier indique quels sont les répertoires ou fichiers que les robots ne doivent pas indexer. Lire notre article sur le fichier robots.txt.

Un code (X)HTML correct

De nombreuses pages sont attirantes d'un point de vue graphique mais quand on pointe son nez derrière le rideau ce n'est pas très joyeux. Avec l'apparition des logiciels WYSIWYG, le code HTML est délaissé. En respectant la sémantique des balises, vous améliorez votre présence dans les moteurs de recherche.

Chaque balise à un sens. Il est primordial de choisir les balises en fonction de ce qu'elle veulent dire et non pas du rendu dans un navigateur. Par exemple, la balise <strong> est de mettre en évidence et d'insister fortement sur un terme ou une expression. La plupart des navigateurs affichent le texte en italique mais on s'en moque fnialement car c'est à vous de décider du style grace aux CSS.

Conclusion: ne vous limitez pas à choisir une balise en fonction de ce que cela donne dans un navigateur mais bien du sens donné à cette balise. Si cette démarche ne vous paraît pas importante, elle l'est pour les moteurs de recherche ou mieux, les synthétiseurs vocaux (logiciel pour aveugles) qui peut ainsi adapter le ton de la voix en fonction de l'importance des mots.

Plus d'info: JDNet.

Blog et référencement

On entend souvent dire que les blogs sont souvent mieux référencés que les sites web traditionnels. Un blog régulièrement alimenté et intéressant sera plus facilement référencé effectivement. Les raisons sont diverses:

  • les templates sont souvent correctement codés
  • le blog comporte de nombreux liens internes (vers les archives, les autres catégories) et l'échange de liens externes grossi avec l'expérience du blogging
  • un blog qui gagne en notoriété se verra pointé par des sites dits d'influence
  • une mise à jour fréquente contribue à un bon référencement
  • la réaction des visiteurs via les commentaires est bénéfique

Quelles sont les pratiques à bannir ?

interdictionSpamdexing - Certains webmasters ont tenté de répéter des mots des dizaines de fois en les mettant dans la même couleur que le fond d'écran pour les rendre invisibles. Les moteurs actuels sont capables de comparer la couleur du texte et celle de l'arrière-plan et de rejeter si elle est identique. Du coup, certains n'hésitent pas à encombrer le bas de leur page. Il n'est pas rapre de trouver du contenu qui n'a aucun rapport avec la nature du site (sexe, Pamela Anderson, mp3, Microsoft...) pour augmenter leur chance d'être vu. Soyez prudent !

Cette pratique malhonnête sert à tromper le moteur pour améliorer son référencement. C'est une lame à double tranchant. En cas de détection, votre site sera exclus de la recherche et au ajouté dans une liste noire pendant un an environ.

Cloaking (camouflage) — Aussi appelé page satellite (doorway page). Un moteur de recherche établi un rapport entre le nombre d'occurence d'un mot et le nombre total de mots dans ce contenu. Dans le titre « Vivre sans les pages satellites », la densité du mot pages est d'une occurence pour 4 mots (les articles ne sont pas pris en compte). Du coup, certains webmasters ont gonflé la densité des mots-clés au point de rendre le texte pénible à l'internaute. La solution a été de proposer une page web différente en fonction du visiteur: une page avec un texte traditionnel pour l'humain et une autre dopée aux mots-clés pour le robot. Cette technique est très peu appréciée des moteurs.

Position squatting — Avec son système d'AdWords, Google permet l'achat de mots-clé d'une marque concurrente. Et ce n'est pas parce que c'est techniquement possible que c'est légal... loin de là. Imaginez, vous êtes grossiste en boissons gazeuses au cola et vous achetez les mots clé « Coca-Cola ». De cette façon, une personne qui taperait le nom de la multinationale, retrouverait en haut de la première page un lien sponsorisé vers votre entreprise.

Page jacking — Le page jacking consiste à capturer les meta-tags d’une page classée en première position. Puis à copier ces meta-tags sur une page de son serveur, et à la faire indexer via une technique de cloaking. Cette méthode est bien entendu interdite.

Link farms (fermes de liens) — Des milliers de sites factices sont créer et pointent vers le site en question pour augmenter sa popularité.

Spam de commentaires — Avec la montée des blogs, le spam des commentaires n'a cessé d'augmenter. Un logiciel pirate permet de déposer automatiquement un grand nombre de commentaires sur les blogs, forums, wiki... et contenant tous un lien vers le site du client.

Réaffectation d'un domaine — Un nom de domaine populaire est racheté pour redirigé le traffic. Une autre astuce consiste à occuper tous les noms de domaine libres d'une grande société et contenant une erreur souvent commise par l'utilisateur. S'il était libre www.amazone.com pourrait rediriger vers un site pornographique. Le site www.belgium.be a longtemps appartenu à une société de sonneries pour GSM alors que les visiteurs s'attendaient certainement à voir le site officiel du pays.

Plus d'info: conseils de Google pour webmasters

Quelques conseils

10 conseils
  1. favorisez le contenu à la forme
  2. échangez vos liens
  3. adaptez les meta et le titre de chacune de vos pages
  4. évitez le système de frame et les sites tout en flash
  5. nommez correctement vos pages, vos images
  6. labelisez correctement vos liens en quelques mots
  7. réservez un nom de domaine adapté
  8. faites des mises à jour régulières
  9. ne trichez pas !
  10. suivez l'évolution de votre référencement

Liens utiles

  • Webrankinfo: des conseils, de l'info, des dossiers et des forums très actifs
  • Abondance: des pros parlent du référencement et des moteurs de recherche
  • Comment ça marche: un dossier pratique sur le référencement
  • Dixxit: « Référencement, la revanche du contenu » (février 2007)

 

1 | 2

 

Réalisé le 22 mai 2004.
Mis à jour le 12 avril 2007.

haut