![]() |
||||||
RéférencementLe classement des recherchesLes critères de pertinence utilisés par les moteurs sont assez complexes et sont d'ailleurs gardés secrets. Chaque moteur utilise ses propres critères, ce qui explique que la réponse obtenue sera différente pour Google, Altavista ou Voila. L'ensemble des critères forment ce que l'on appelle l'algorithme de classement. Les critères peuvent être classés en 2 grandes catégories: le contenu de la page (meta, titre, premiers mots du body, ...) et la popularité du site (nombre de liens vers le site et le nombre de visiteurs du site). Ceci n'est pas totalement exhaustif. D'autres points, comme le nom de domaine ou l'ancienneté, peuvent aussi influencer le classement. On peut dire qu'en règle générale, ils se basent d'abord sur la fréquence et la localisation des mots clés. Les pages web dont le nom comporte le mot clé demandé sont supposées se rapporter davantage au sujet. Les moteurs de recherche vont également vérifier si les mots clés apparaissent dans la première partie de la page, c'est-à-dire dans le titre de la page et dans les premiers paragraphes. L'idée de départ est que, si une page est consacrée à un certain thème, ce thème est mentionné dès le début du texte. La fréquence est également un facteur important dans le classement: les moteurs de recherche analysent le nombre d'occurrences d'un mot clé. Si un mot clé revient de nombreuses fois sur une page, c'est parce que ce mot clé est plus important que les autres. Évidemment, ce critère n'est pas un gage de qualité. A fortiori quand les webmasters tentent d'adapter leur contenu au crawler plutôt qu'au visiteur. Il est intéressant de s'attarder sur les techniques de Google, n°1 des moteurs de recherche. Ces techniques sont très caricaturées mais c'est pour bien comprendre le principe.
Quels sont les moteurs incontournables ?
Faut-il référencer ma page d'accueil ou toutes mes pages ?Bien souvent, le référencement de la page d'accueil suffit mais il a été remarqué quelques lacunes à ce niveau. Mieux vaut donc référencer toutes ses pages une par une. Mais attention, les moteurs de recherche se protègent contre le référencement abusif. Pour éviter de voir votre site refusé, inscrivez manuellement une page par jour. Asutce: pour savoir quelles sont les pages référencées par Google tapez: site:www.monsite.com Quel est le temps entre l'indexation et le référencement effectif ?Lorsque le site est inscrit dans les différents moteurs et annuaires (indexation) il faut attendre entre quelques jours et quelques mois (maximum 6) pour être référencé. Tout dépend du moteur ou de l'annuaire. Mais la moyenne semble tourner aux alentours de 6 semaines. Quid des sites en Flash ?Depuis le début, les sites conçus avec la technologie Flash ont du mal a être référencés. Ce problème est dû à l'absence de code HTML qui ne permet pas de renseigner les moteurs de recherche sur le contenu. Depuis quelques temps il semblerait que Google gère les animations Flash à en juger notre recherche. Il répertorie les animations mais peut également déchifrer le contenu à condition qu'il s'agit de texte éditable (possible que dans les dernière versions de Flash). Pour le moment le sujet est assez vague et on ne connaît pas très bien l'efficacité de ce système ni les critères de recherche. Sites dynamiquesLes sites dynamiques sont reliés à des bases de données. Le nom des pages est généré à la volée. Ces pages sont plus difficiles à référencer car les moteurs ne les indexent pas toujours telles quelles. Ce souci peut être résolu en appliquant des règles d'URL rewriting (ré-écriture des URL). Peut-on interdire le référencement de certaines pages ?Puisque les moteurs cherchent sans arrêt les pages présentent sur la toile, on pourrait penser qu'aucune page ne lui échappe. Et bien non ! On vient de voir qu'il était important d'adapter une page HTML pour les sites réalisés entièrement en Flash. Si certaines de vos pages ont un caractère confidentiel, il est facile de demander aux moteurs de ne pas les référencer. La première possibilité est d'utiliser une balise
L'autre solution est d'utiliser un fichier texte nommé robots.txt (en minuscules), placé à la racine du serveur. Ce fichier indique quels sont les répertoires ou fichiers que les robots ne doivent pas indexer. Lire notre article sur le fichier robots.txt. Un code (X)HTML correctDe nombreuses pages sont attirantes d'un point de vue graphique mais quand on pointe son nez derrière le rideau ce n'est pas très joyeux. Avec l'apparition des logiciels WYSIWYG, le code HTML est délaissé. En respectant la sémantique des balises, vous améliorez votre présence dans les moteurs de recherche. Chaque balise à un sens. Il est primordial de choisir les balises en fonction de ce qu'elle veulent dire et non pas du rendu dans un navigateur. Par exemple, la balise Conclusion: ne vous limitez pas à choisir une balise en fonction de ce que cela donne dans un navigateur mais bien du sens donné à cette balise. Si cette démarche ne vous paraît pas importante, elle l'est pour les moteurs de recherche ou mieux, les synthétiseurs vocaux (logiciel pour aveugles) qui peut ainsi adapter le ton de la voix en fonction de l'importance des mots. Plus d'info: JDNet. Blog et référencementOn entend souvent dire que les blogs sont souvent mieux référencés que les sites web traditionnels. Un blog régulièrement alimenté et intéressant sera plus facilement référencé effectivement. Les raisons sont diverses:
Quelles sont les pratiques à bannir ?
Cette pratique malhonnête sert à tromper le moteur pour améliorer son référencement. C'est une lame à double tranchant. En cas de détection, votre site sera exclus de la recherche et au ajouté dans une liste noire pendant un an environ. Cloaking (camouflage) — Aussi appelé page satellite (doorway page). Un moteur de recherche établi un rapport entre le nombre d'occurence d'un mot et le nombre total de mots dans ce contenu. Dans le titre « Vivre sans les pages satellites », la densité du mot pages est d'une occurence pour 4 mots (les articles ne sont pas pris en compte). Du coup, certains webmasters ont gonflé la densité des mots-clés au point de rendre le texte pénible à l'internaute. La solution a été de proposer une page web différente en fonction du visiteur: une page avec un texte traditionnel pour l'humain et une autre dopée aux mots-clés pour le robot. Cette technique est très peu appréciée des moteurs. Position squatting — Avec son système d'AdWords, Google permet l'achat de mots-clé d'une marque concurrente. Et ce n'est pas parce que c'est techniquement possible que c'est légal... loin de là. Imaginez, vous êtes grossiste en boissons gazeuses au cola et vous achetez les mots clé « Coca-Cola ». De cette façon, une personne qui taperait le nom de la multinationale, retrouverait en haut de la première page un lien sponsorisé vers votre entreprise. Page jacking — Le page jacking consiste à capturer les meta-tags d’une page classée en première position. Puis à copier ces meta-tags sur une page de son serveur, et à la faire indexer via une technique de cloaking. Cette méthode est bien entendu interdite. Link farms (fermes de liens) — Des milliers de sites factices sont créer et pointent vers le site en question pour augmenter sa popularité. Spam de commentaires — Avec la montée des blogs, le spam des commentaires n'a cessé d'augmenter. Un logiciel pirate permet de déposer automatiquement un grand nombre de commentaires sur les blogs, forums, wiki... et contenant tous un lien vers le site du client. Réaffectation d'un domaine — Un nom de domaine populaire est racheté pour redirigé le traffic. Une autre astuce consiste à occuper tous les noms de domaine libres d'une grande société et contenant une erreur souvent commise par l'utilisateur. S'il était libre www.amazone.com pourrait rediriger vers un site pornographique. Le site www.belgium.be a longtemps appartenu à une société de sonneries pour GSM alors que les visiteurs s'attendaient certainement à voir le site officiel du pays. Plus d'info: conseils de Google pour webmasters Quelques conseils
Liens utiles
1 | 2
|
||||||