Classification hiérarchique

Un moteur de recherche est un algorithme qui ne comprend qu’un langage mathématique. Les fameux 0 et 1 du système binaire. Il est donc incapable de lire.

Dès lors, comment font les programmeurs pour afficher un contenu en rapport avec la requête de l’internaute ? Par la classification hiérarchique.

Un procédé qui repose sur des techniques comme la LDA (Latent dirichlet allocation) et la PSLA (probalistic latent semantic analysis). Le but ? Identifier les occurrences d’un texte avec celles d’un thème.

Nuage de points

La rédaction orientée SEO vise donc à associer des mots en cohérence avec un contexte.

Pouvez-vous imaginer un article sur “Lipton” sans la mention “Thé”, “glacé”, ou encore “vert” ? Google non plus.

A cela s’ajoute une répartition des mots-clefs selon des “bonnes pratiques”, considérées comme facilitant la compréhension du texte par l’algorithme de Google.

La répartition en nuage de mots témoigne de ce travail d’analyse algorithmique.

Nuage de mots

L’occurrence du mot-clef et de son champ lexical, permet à l’algorithme de comprendre le sujet de l’article, mais également ses sous-thèmes.

D’ailleurs, l’algorithme de Google est si performant qu’il peut même vous afficher la partie du texte qui répond à votre requête.

L’objectif du rédacteur web ? Que ses articles soient tout autant accessibles aux humains qu’aux robots.