Web 2.0 : vers des identités numériques truquées ?

mercredi 16 février 2011

Flash sur l'internet! C'est désormais le réflexe qu'on peut avoir assez spontanément pour dresser l'inventaire des données personnelles d'un individu. Serons-nous bientôt tous des grands-hommes dans l'encyclopédie du Web, statut réservé jusqu'alors dans les manuels aux individus ayant marqué l'histoire? Le processus de signification assisté par le réseau nous conduit-il vers plus de facilité ou vers plus de difficulté dans la construction de la connaissance des personnes? L'information literacy est-elle à la portée des internautes rendus à la facilité apparente procurée par les moteurs de recherche sociaux? Nous allons tenter de trouver des réponses à ces questionnements.

Le résultat produit par les outils de recherche documentaire désormais  disponibles sur l'internet a des effets assez remarquables tant sur les contenus que sur les cheminements cognitifs,  effets que nous analysons à travers les signes  composites qu'ils génèrent à un moment où l'identité numérique devient une préoccupation forte des dirigeants de ce monde.

Dès le début des années 1990 et la conception du World Wild Web, la problématique de l'indexation des données était mise en avant. Structuré en pages, le Web faisait ressortir dès le départ le problème du repérage des informations et un « web  sémantique » était mis en projet dans la perspective d'une montée en charge des contenus que l'avenir a largement confirmé puisqu'on exprime le nombre de pages en ligne en 2011 à la puissance douze, c'est à dire en trillon (1000 milliards) (1) dont environ 40 milliards seraient indexées par Google contre 26 millions en 2006. Ce projet de web sémantique visait à fournir les outils de structuration de l'information sur la base d'une catégorisation des données (2) associée à de puissants outils d'indexation. L'engouement des internautes depuis l'arrivée du Web 2.0 au milieu de la première décennie des années 2000 n'a pas laissé au web sémantique le temps de s'imposer et donne aujourd'hui lieu à une extraordinaire pagaille sémiotique. Le Web 2.0 a été l'avènement des « réseaux sociaux », sortes de lieux de rencontre dans la sphère virtuelle où chaque individu de notre planète disposant d'un accès à l'internet est libre de publier tout type d'information relative à tout type de sujet et en particulier relative à lui-même (3). Apportant naturellement une réponse à la question de la localisation des données sur les réseaux sociaux, les moteurs de recherche se sont penchés sur ce nouvel environnement donnant naissance aux « moteurs de recherche sociaux ». Même si les technologies mises en œuvre pour localiser et restituer l'information ne sont pas exposées en toute transparence, la technique du « mashup » est largement usitée. Alors arrêtons-nous quelques instant sur ce mashup.
La traduction directe de l'anglais nous donne le mot purée en français, le résultat produit par le mashup s'apparenterait-il à une purée informationnelle?
La purée authentique est le résultat d'une extraordinaire recette qui repose sur le seul fait d'écraser des pommes-de-terre, résultat que l'on peut agrémenter à sa guise en y ajoutant du beurre ou du lait. Mais quelle peut donc être la recette sémiotique de la purée informationnelle? Au départ la technique du « mashup » permettait de produire des extraits musicaux par la fusion de plusieurs extraits existants (4). Cette technique, étendue à l'information textuelle  permet désormais de construire des documents hybrides au sein desquels des informations en provenance de plusieurs sources sont rassemblées en une unité raccrochée à une entrée sémantique donnée. Il se trouve que dans le cas des moteurs de recherche sociaux, l'entrée sémantique n'est rien d'autre que l'association d'un nom de famille et d'un prénom, ce qui en soi est déjà une information nominative. La purée informationnelle issue des réseaux sociaux n'est donc rien d'autre qu'un traitement automatisé d'informations nominatives, processus bien cadré légalement en France (5) mais que le Web sans frontière tend à laisser s'opérer en s'affranchissant de toute considération juridique. Ce n'est pas de cet aspect que nous voulons traiter ici en tant que sémioticien, même s'il est préoccupant, mais de la valeur signe des informations hybrides et de la qualité sémiotique de l'assistance numérique fournie à l'internaute dans son parcours du chemin d'accès à l'information.
Revenons sur l'architectonique du signe.  Un signe est un processus dynamique ayant pour résultante une signification. Il est triadique, c'est un vecteur qui connecte l'esprit de l'individu à un objet par l'intermédiaire d'un signe d'interprétance. Pour faire un raccourci, lorsque nous observons de la fumée, si notre esprit est connecté au concept de feu, c'est parce que l'objet du signe (le feu), est convoqué par l'intermédiaire d'un élément de connaissance qui est un autre signe que nous avons acquis et mémorisé antérieurement et que nous nommons signe interprétant (6). Il n'y a pas d'équivoque possible, le signe perçu pointe vers le bon objet dès lors que l'interprétant est bien possédé. Autre exemple donné pour bien comprendre le processus sémiotique, les peintures rupestres des grottes préhistoriques présentent des graphismes dont nous inférons qu'ils signifient des animaux sans bien entendu qu'il s'agisse d'animaux puisque ce sont des peintures (7). Notre interprétant nous a appris que ces formes-là en pareille circonstance représentent des animaux préhistoriques.
Sur le Web 2.0, les moteurs de recherche sociaux procèdent à une  construction syncrétique d'informations personnelles par de subtils assemblages. Ces informations sont ensuite capitalisées dans des bases de données pour devenir des informations de base qui seront retraitées par un processus à venir et ainsi de suite. Ce phénomène nous plonge dans la réflexion sur l'agilité numérique (8),  terme évocateur bien que toujours pas consensuel pour désigner ce que les anglo-saxons ont introduit par « information literacy ». Cette agilité numérique repose sur la batterie des savoirs et des compétences qui font qu'un internaute est en mesure de construire son savoir dans le magma informationnel de l'internet. Il ne s'agit donc pas d'un processus simple mais plutôt d'un ensemble de démarches inférentielles que l'individu mis face au Web doit mener pour construire son résultat documentaire.
Dans le cas du mashup opéré par les moteurs de recherche sociaux, s'il est pris sans aucune forme de critique, le résultat de la recherche correspond à la classe de signe la plus élevée dans la hiérarchie cognitive, il s'agit d'un argument. C'est à dire un sens construit. Or, ce sens n'est pas  construit par un individu en situation d'interprétation mais par un dispositif informatique. On connaissait le sens construit par l'intelligence collective à l'instar de Wikipédia, dans une forme humaine où une communauté élabore un argumentaire qui devient « encyclopédique » par validations successives, on rencontre désormais des argumentaires produits de manière robotisée par des moteurs de recherche de personnes disponibles en ligne (9).
Peut-on parler de signification  assistée par le réseau pour autant? Pour répondre à cette question nous devons décortiquer le processus sémiotique traditionnel au long duquel un individu procède à une enquête cognitive à travers divers médias pour ensuite inférer en partant des signes collectés et sélectionnés au regard d'un savoir qui se construit par adjonction de savoirs nouveaux jusqu'à posséder un agrégat estimé comme étant suffisant pour constituer un signe résultat : l'argument. Par exemple à la question « qui était Napoléon? » posée par un enseignant, l'élève formera un corpus au terme de diverses recherches et élaborera sa réponse argumentée. Ce corpus sera construit en bonne intelligence notamment par analogie aux informations possédées dont celles transmises par l'enseignant, ce qui constituera une forme de guidance et garantira la justesse de la réponse, justesse directement liée à la proximité du résultat de l'enquête cognitive vis à vis de l'acquis antérieur. Ce travail de repérage, de collecte et d'agrégation de signes est réalisé par les moteurs de recherche selon des procédés techniques flous. On ne connaît d'ailleurs en général pas la méthode utilisée avec précision en revanche on peut observer le résultat et analyser s'il peut constituer un savoir fiable.
Prenons le cas du moteur de recherche de personnes « 123people » dont un recruteur ferait usage pour savoir qui est le candidat qui se cache derrière la lettre de motivation dont il a été destinataire. Le résultat produit est restitué sous la forme d'une page d'écran composée de zones thématiques rassemblant des informations trouvées sur l'internet relatives à la personne recherchée. Tout au moins c'est ce que l'on pourrait croire. La personne en question est signalée au moteur de recherche par l'association d'un prénom et d'un nom. Elle devient un concept à l'instar du concept de pomme qui déclencherait une avalanche de résultats (10) dans un moteur de recherche. Un problème de taille se fait jour : un individu n'est pas un concept, il est un existant singulier que seuls son nom et son prénom ne permettent pas d'identifier avec exactitude. Dès lors le signe produit par les moteurs de recherche de personnes répond à un montage sémiotique très particulier. Nous sommes en présence d'un signe qui pointe vers plusieurs objets. Ainsi, l'instance « objet » de la triade objet-signe-interprétant est multivaluée. En d'autres termes la guidance qu'est censée offrir le moteur de recherche à l'internaute induit plus de confusion qu'une recherche méticuleuse non assistée. Le résultat produit par le moteur de recherche de personnes est une carte d'identité numérique autoconstruite qui mêle allègrement des traces laissées sur l'internet par différents acteurs et dont la seule cohérence serait que ces acteurs aient en commun un nom et un prénom. Une sorte de portrait  robotisé absurde.

On voit combien le web 2.0 avec ses réseaux sociaux manque plus que jamais d'un outillage sémantique développé. Avec les moteurs de recherche de personnes, l'histoire de l'internet aura été jalonnée d'une étape où certains se seront autorisés la production de  fiches d'identité numérique  truquées...


1) Google n'indique désormais plus le nombre de pages indexées et le trillon est un ordre de grandeur car le concept de page ne correspond plus à ce qu'il était au départ du fait de l'arrivée des blogs des tchats et autres réseaux sociaux qui donnent aux internautes la possibilité de générer des milliers de pages en une seule seconde.
2)De nombreux dispositifs ont été proposés : des méta-descripteurs aux langages naturels.
3) Facebook est certainement l'exemple le plus représentatif de cette dynamique des réseaux sociaux.
4) Le site www.i-cone.net propose son Mashup Music Player qui permet de se rendre compte du résultat produit par l'hybridation d'extraits musicaux.
5) La France a été le premier pays au monde à se doter dès 1978 d'une loi dite de l'informatique et des libertés destinée à préserver les individus des traitements automatisés d'informations nominatives.
6) Depuis la définition donnée par Robert Marty à la fin des années 1990, il est admis que l'interprétant est constitué par l'habitus social de tout individu.
7) Pensons au célèbre tableau de René Magritte « ceci n'est pas une pipe ».
8) Le terme agilité numérique a été proposé par le journaliste Philippe COUVE en 2007
9) On peut citer notamment 123people, pipl, Wink, Spock, Zoominfo, Zabasearch, peekyou etc.
10) Google retourne environ 9 250 000 résultats concernant « pomme»
 

Les plus lus

Blogger news

Blogroll