Créer un site référençable : introduction

Date Posté le 11 septembre 2008

Première partie d’un petit livre blanc que j’ai décidé d’écrire pour sensibiliser l’ensemble des acteurs de la création d’un site Internet : webdesigners, intégrateurs, développeurs, … au référencement naturel.

J’espère y aborder simplement le fonctionnement des moteurs de recherche, et les bonnes pratiques que chacun devra intégrer à son travail de tous les jours.

Objectif : savoir construire un site web référençable… et apprécié des moteurs :)

Introduction

Contrairement à la plupart des guides sur le référencement, celui-ci ne s’adresse pas directement aux référenceurs, mais à leurs bras droits :

  • les web designers,
  • les intégrateurs,
  • les développeurs,
  • les chefs de projet,

dont le rôle dans la réalisation d’un site web et son référencement est primordial. En effet, avant de penser “positionnement” il est indispensable de travailler sur l’optimisation et l’indexation d’un site web !

> Ce document vous rappelle les principaux écueils à éviter pour empêcher le parcours paisible et sans faute de votre site par un moteur de recherche. Comme vous le constaterez ce travail intervient à tous les niveaux de la création d’un site : webdesign, intégration, développement… et copywriting (rédaction des contenus).

Objectif : favoriser au maximum son bon référencement !

Quelques bases et rappels : les araignées

Fonctionnement

Afin d’indexer le contenu de tout site Internet, l’ensemble des moteurs de recherche disposent d’”araignées” (ou “crawlers”, “bots”), robots envoyés automatiquement sur les sites à indexer, qui explorent et enregistrent le contenu des pages, une à une, en suivant les liens naturels dudit site.

Chaque crawler est différent, car “fait maison” par les moteurs de recherche. Tous ont cependant la caractéristique commune de se comporter comme un navigateur ultra-basique.  Si vous souhaitez vous faire une idée de ce que ces robots “voient” en parcourant votre site, installez le navigateur Lynx et utilisez le pour naviguer.

Ce navigateur ne sait lire que le code basique d’une page HTML (mise en forme, liens) et aspirer le contenu textuel des sites. Il ne sait pas déchiffrer et décrire le contenu d’une image ou d’un flash, ni interagir avec une animation Flash, ou encore utiliser des formulaires.
Dans les grandes lignes, il se comporte donc comme Googlebot ou Slurp par exemple.

/!\ Les moteurs de recherche de moyenne à grande envergure ont tous baptisé leur crawler. Vous retrouverez ces noms en vous intéressant aux logs de votre site ! D’autres crawlers ne laissent que leur adresse IP.

  • Googlebot > Google
  • Slurp > Yahoo
  • MSNBot > Live Search

Quand les araignées passent à l’action

Quel que soit le moyen par lequel le crawler arrive sur un site, il en parcourt ensuite les pages une à une de la façon suivante :

  • lecture du code de source de haut en bas et de gauche à droite,
  • tous les liens en dur (de la forme “a href”) sont suivis, selon leur ordre d’apparition dans le code,
  • ne sont ni parcourus ni indexés : le contenu des images et des animations flash.

L’ensemble des données ainsi récoltées par les araignées sont stockées dans les bases de données de chaque moteur. Toutes ces données sont dans un second temps brassées par un algorithme (dont chaque moteur garde jalousement le secret), qui permettra ensuite d’attribuer un positionnement adéquat au site dans les résultats du moteur.

A suivre dans la partie 2 : … quelques règles d’or destinées aux web designers !



2 commentaires sur “Créer un site référençable : introduction”

  1. Quel rôle pour le SEO dans une web agency ? | Weboscopie a écrit :

    [...] Un brin de vulgarisation permet d’expliquer en quelques lignes le fonctionnement d’un moteur de recherche, [...]

  2. Créer un site référençable, partie 2 : webdesigners | Weboscopie a écrit :

    [...] de ce petit “mode d’emploi” destiné aux intervenants de ma webagency. Après l’introduction générale, cette nouvelle partie s’adresse aux webdesigner. J’y présente quelques règles [...]

Ecrire un commentaire