Google lance son algorithme d’indexation du Flash
Posté le 2 juillet 2008
Grâce à un travail d’équipe entre les ingénieurs de Google et les ingénieurs d’Adobe, Google gérera désormais l’indexation du contenu de vos menus ou interfaces en Flash. C’est une petite révolution dans le monde du Search Engine Marketing, mais probablement une moins bonne nouvelle pour les ergonomes ou les spécialistes de l’accessibilité…
Petit récapitulatif de l’interview “questions / réponses” à laquelle ont participé Ron Adler et Janis Stipins, tous deux ingénieurs chez Google (équipe “indexation”).
Fonctionnement
Les ingénieurs de Google ont développé un algorithme qui permet d’explorer un fichier flash comme le ferait un humain : en suivant des liens, en entrant des informations dans un champ de saisie,…
Tout contenu rencontré lors de cette exploration est mémorisé puis traité pour une indexation sur Google, comme c’est déjà le cas avec les pages classiques en HTML.
Qu’est-ce qui est indexé ?
- N’importe quel fichier de type SWF, qu’il s’agisse d’un “gadget” (bouton, bandeau pub, menu), ou d’un site 100% Flash,
- L’intégralité du contenu textuel directement inclus dans les fichiers Flash,
- Les liens rencontrés dans les fichiers SWF.
On notera également que les contenus indexés pourront servir à alimenter les “snippets” affichés sur les pages de résultats de Google.
Si votre Flash contient des images, ces dernières ne sont ni détectées ni indexées par Google > tout texte présent dans une image sera donc ignoré.
Inversement, les textes de chargement ou de copyright seront eux indexés, Google recommande de les transformer en images s’ils viennent “polluer” la présentation de votre site sur les pages de résultats.
Enfin, les fichiers de type FLV sont ignorés car ils sont dépourvus de contenu textuel.
Pour les webmasters, ça change quoi ?
Les webmasters n’auront pas besoin de changer leurs méthodes de travail pour que le Flash soit correctement indexé : Google prend désormais automatiquement en compte l’indexation de tout SWF qui se présenterait sur la route de ses robots d’indexation.
Quelles sont les limites de ce nouvel algorithme ?
Le Googlebot n’exécute pas un certain nombre de javascripts. Si votre Flash est chargé sur une page à l’aide d’un Javascript, il est fort possible que Google ne voie pas votre fichier Flash, et ne puisse donc pas l’indexer.
Si votre fichier fait appel à des fichiers extérieurs pour se générer (HTML, XML, autre Flash,etc…), ces derniers ne seront pas associés au Flash. Ils seront bien indexés mais de façon séparée. En d’autres termes, le contenu qu’il permettent de générer ne sera pas associé à votre fichier Flash.
Google rencontre un cerrtain nombre de difficultés quant à l’indexation des contenus écrits en textes bidirectionnels (Hébreux, Arabe,…). Dans l’immédiat, les fichiers Flash qui répondent à ce critère ne sont donc pas indexés.
La preuve par l’exemple
Lisez les snippets présents sur cette page de résulats.
A voir aussi
Adobe : SWF Searchability FAQ (en English dans le texte)
Annonce officielle sur le blog Google “Webmaster Central” (English aussi)
Annonce officielle chez Adobe (toujours in English dans le texte)
Post scriptum
Il semblerait que Yahoo! se mette également à la page (toujours grâce à l’ouverture d’une portion de code d’Adobe). Je n’arrive cependant pas à mettre la main sur l’annonce officielle, j’ai donc préféré mettre l’accent uniquement sur les nouveautés avérées : celles de Google.
Posté dans
content rss
9 octobre 2008 à 6:42
Oh zut alors, même plus la peine de dupliquer le site en HTML pour être référencé.
Même pas drôle.