Accueil du site > laboratoire > L’infosphère, lieu d’existence de l’objet (...)

recherche

L’infosphère, lieu d’existence de l’objet numérique

jeudi 3 octobre 2002, par michael

Projet de mémoire pour le DEA Enjeux sociaux et technologies de la communication, option Création et communication multimédia. Tout commentaire est le bienvenu !


« Pour anticiper ce qui de l’inconnu est susceptible d’être acquis à la connaissance, la pensée scientifique doit inlassablement prendre le risque d’interroger le réel en fonction d’un possible dont elle sollicite les virtualités par la pensée et l’expérimentation. » (Dominique Lecourt, article Épistémologie du Dictionnaire d’Histoire et de Philosophie des Sciences).

Vingt années de fréquentation assidue des systèmes informatiques, dont dix-huit en pratiquant le journalisme -spécialité : technologies du numérique-, m’ont conduit à m’intéresser d’abord aux moyens de production et de diffusion de l’information ensuite à la nature même du média numérique. Pour le compte des groupes de presse qui m’ont employé, j’ai imaginé, développé et mis en place des systèmes de production et de publication plurimédias : un mensuel spécialisé accompagné de disquettes, de CD-ROM, d’un service télématique et d’un babillard (Bulletin Board System) ; un hebdomadaire professionnel et son site web ; un portail d’information nourri par sa rédaction et le contenu de huit journaux.

Un fait s’est imposé au fil des expériences. Lorsque l’on produit de l’information avec le média numérique, il est impossible de raisonner comme avec ses prédécesseurs. Cela découle d’une caractéristique constitutive du média. Les mêmes technologies -matériels informatiques, réseaux, logiciels, code binaire- servent de substrat à l’information à toutes les étapes de son cycle de vie, quelqu’en soit la forme et l’état, de la production à la diffusion et la consommation. À l’inverse, les médias traditionnels changent de support à chaque étape d’élaboration de l’information, de la machine à écrire jusqu’aux plaques de la presse d’imprimerie par exemple. La production de l’information s’accomplit par approximations successives, chaque support reproduisant le précédent par analogie.

Cette particularité appelle quelques commentaires :


- la capture de l’information exige une mise en forme spécifique -par reproduction numérique d’un objet physique ou par création numérique- qui suppose l’existence de la chaîne complète de traitement. Ce qui entre dans le système technique a les caractéristiques exclusives du système technique pour être stocké, traité, publié, transporté, consommé par transformation logicielle. Ce n’est pas le cas pour la photo, par exemple, sauvegardée sur un film et imprimée dans un journal ;
- si le média numérique a la capacité de simuler les autres médias, il ne les remplace pas. Sa nature immatérielle lui interdit de reproduire à l’identique les médias à support physique. Un article imprimé dans un journal diffère de sa représentation numérique affichée à l’écran ; court ou long, l’article est seul dans la page web, il est accompagné de les liens hypertexte, différemment, etc. ;
- la représentation numérique d’une information est difficilement perçue de la même manière par son producteur et par son consommateur du fait de la disparité des technologies. Il suffit de consulter le même site web avec pluieurs logiciels de navigation pour s’en convaincre : l’affichage n’est jamais identique. Aussi comment savoir ce que l’auteur des pages html a vu lorsqu’il les a construites ;
- quiconque produit de l’information avec des moyens informatiques peut la diffuser à l’échelle planétaire ; en conséquence, le statut de producteur d’information s’étend bien au-delà des seuls médias traditionnels pour englober, potentiellement, toute organisation et tout individu.

L’infosphère comme objet observable

Ces observations incitent à réfléchir sur le média numérique non plus comme un moyen de production dont on interroge certains des processus fonctionnels mais comme un objet que l’on observe dans sa totalité. Au premier regard, il est possible de distinguer deux composantes :


- le système technique de collecte, d’enregistrement, de stockage, de traitement, de transport et de mise à disposition des données numériques ;
- les données numériques qui se trouvent dans le système technique sous forme de flux ou de stocks, que ces derniers soient accessibles ou non.

Le terme « infosphère » a été préféré à tout autre pour désigner cet objet composite. Il est attribué à l’écrivain de science-fiction Dan Simmons qui l’a utilisé dans la saga Hyperion, dès 1990. Il a été adopté, aux alentours de 1995, chez les militaires américains qui l’appliquent indifféremment à une planète ou à un individu. Ils parlent dans ce cas-ci de "person’s infosphere" (infosphère individuelle) : « Une infosphère individuelle comprend la totalité des instruments, appareils, ordinateurs, services et personnes joignables depuis l’environnement d’un individu, où qu’il se trouve (par exemple, au bureau, en avion ou sur le pont d’un bateau). » [1]

En France, Eric Baptiste, rapporteur du groupe "Convergence technologique et stratégies industrielles", explique ainsi le choix de ce terme pour son rapport : « Le phénomène ne doit pas s’interpréter comme une unification des secteurs [de l’informatique, des télécommunications et des médias], mais plutôt, grâce à leur interconnexion, comme la tendance à la prolifération des contenus susceptibles d’être transportés sur tous supports, justifiant d’ailleurs la préférence pour l’expression "infosphère" qui sera retenue dans ce rapport. » Il poursuit : « Tout humain, disposant d’une interface avec cet essor de contenus numérisés baignant la planète, aura pour ainsi dire accès en temps réel à une sphère virtuelle de ressources potentielles illimitées : l’infosphère. » (L’infosphère : stratégies des médias et rôle de l’État).

L’interaction permanente entre le système technique et les données numériques est une condition nécessaire à son fonctionnement. L’étude des mécanismes qui président à cette interaction pousse à découvrir quels objets élémentaires existent dans l’infosphère et quels processus opèrent sur eux.

La donnée et l’information dans l’infosphère

Les recherches conduites en science informatique n’ont pas directement pour objet l’infosphère. Beaucoup se cantonnent à la recherche appliquée ; il s’agit, avant tout, d’améliorer les capacités du système technique sur les plans matériel et logiciel, pour ses utilisateurs. Les recherches plus fondamentales se consacrent d’abord aux phénomènes perceptibles, les résultats de l’interaction avec l’infosphère.

Ce que nous percevons de ce qui se déroule dans l’infosphère est une représentation partielle délibérément adaptée à nos sens -du moins suffisamment adaptée à nos sens pour que nous puissions interpréter l’information ; par exemple, une image affichée en basse définition nous suffit pour reconnaître ce qu’elle représente. Les textes que nous lisons à l’écran, les sons que nous écoutons, les images fixes ou animées que nous regardons... Pour nous, ce sont des données porteuses de sens, des informations. Elles le sont uniquement parce qu’elles ont été interprétées par le système technique pour qu’il nous les rende intelligibles. Dans l’infosphère, ce sont des ensembles de bits ordonnés et structurés qui ont été répliqués, transmis puis traités par une succession de processus logiciels jusqu’à une interface matérielle -écran, haut-parleur, feuille de papier, etc.

Ces ensembles de bits ordonnés et structurés sont le support logique de l’information. Ils contiennent les données et les codes nécessaires pour qu’un flux binaire apparaisse à son consommateur comme une information compréhensible. Corollaire direct, les objets numériques que sont ces séquences binaires ne sont pas perceptibles en tant que tels.

Ils rappellent en cela les objets mathématiques « car ils ne sont pas saisissables comme tels dans une expérience sensible ». Ils s’apparentent surtout à l’objet scientifique : « Ainsi [il] appartient bien à un mode de représentation du réel radicalement différent de celui de la perception, et d’abord en ce qu’il évacue les qualités sensibles ». Ces objets numériques devraient donc vérifier le propos « il n’est de science que du structurable » (Gilles Gaston Granger).

Les chercheurs en science de l’informatique font une partie du travail de structuration avec la modélisation objet, la méthode UML (Unified Modeling Langage) en particulier. Celle-ci consiste à créer une représentation informatique des éléments du monde réel auxquels on s’intéresse, indépendamment du langage de programmation. Il s’agit de déterminer les objets présents puis d’isoler leurs données et les fonctions qui les utilisent pour en tirer les attributs, les méthodes et les identités décrivant le modèle de l’objet.

La programmation de l’objet modélisé crée un objet numérique dans l’infosphère, qui existe préalablement à toute actualisation nous le rendant perceptible. L’objet numérique continue d’exister inchangé s’il est actualisé, car tous les traitements s’appliquent à une copie de l’objet.

David M. Levy voit dans ce processus de réplication une déclinaison du modèle industriel où des copies toutes identiques sont produites sans original (le moule et tous les objets qui en sortent). « Comme pour les imprimés ou les enregistrements sonores ou vidéo, les documents numériques sont fondés sur la distinction entre une source et les copies qui en sont tirées. La source est une représentation numérique d’un certain type, une accumulation de bits. Les copies sont les impressions ou les manifestations perceptibles -texte, graphique, son, que sais-je encore- qui passent sur le papier, à l’écran ou sur les ondes. » (Where’s Waldo ? Reflections on Copies and Authenticity in a Digital Environment).

Ce propos appelle deux réserves. L’auteur restreint le sens de copie à celui d’actualisation alors même que le processus de copie est une fonction générique dans l’infosphère. La notion de source, pertinente dans le monde physique -on ne réplique pas le moule comme on produit les copies- paraît difficilement transposable au numérique. L’objet numérique est constitué de données source réplicables à l’identique, indépendamment de toute actualisation.

L’objet numérique, encodé et renseigné

Le problème de la conservation des sources numériques pousse les chercheurs en informatique documentaire à manipuler le concept d’objet numérique, sans s’accorder sur une définition. Les promoteurs du Cedars Project de l’Université de Leeds en parlent comme de « la description d’un objet qui peut être représenté par un ordinateur ; il peut s’agir d’une base de données, d’une feuille de calcul, d’un document issu d’un traitement de texte, d’une page web, d’une image, d’une séquence vidéo ou audio, d’une carte, d’un modèle 2D ou 3D, etc. » [2]. Les bibliothécaires de la California Digital Library retiennent le sens d’objet numérique comme « quelque chose (par exemple une image, un enregistrement audio, un document textuel) qui a été encodé numériquement et associé à des métadonnées qui permettent la découverte, l’usage et le stockage de ces objets. » [3].

Catherine Lupovici et Julien Masanès, de la Bibliothèque Nationale de France, ont mené des travaux approfondis sur les objets numériques. Metadata, for the long term preservation of electronic publications décrit précisément une structure fonctionnelle appliquée à l’informatique documentaire. L’objet numérique, au sens documentaire, est ce que l’on doit préserver, qu’il s’agisse d’un objet numérique natif ou d’une reproduction numérique de substitution. Tous les processus logiciels mis en place doivent en assurer l’intégrité, l’authenticité et l’accès à long terme (et aussi les moyens de protection des contenus, élément politique et économique hors du champ d’étude).

Leur réflexion s’appuie sur le Modèle d’information en couches (Layered Information Model, CCSDS). Ce modèle propose une représentation en cinq strates logicielles. Chacune transmet les données à la strate d’ordre supérieur dans une forme rendue compréhensible par un processus de conversion :

- 1. La couche Média passe de la représentation des données par des grandeurs physiques (magnétique, électrique...) à une représentation en séquences binaires ;
- 2. La couche Flux nettoie les données de toutes les scories (contrôle d’erreur, format des paquets...) pour produire une vue logique des données, indépendante du média source, qu’elle transmet en flux ;
- 3. La couche Structure transforme les flux binaires en structures de données primaires (caractères, nombres entiers et réels...) adressables soit sous formes d’enregistrements, qui peuvent mélanger les types de données primaires, soit de tables, qui ne mélangent pas les types ;
- 4. La couche Objet, « qui convertit les agrégats labellisés de données primaires en informations », ajoute des éléments sémantiques pour produire des objets reconnaissables et porteurs de sens au niveau applicatif. Les données sont représentées non plus sous forme primaire mais comme des informations de types distincts, définis par le contenu des objets. La couche Objet fournit aussi une interface cohérente pour les informations de même type qui définit les opérations applicables et, pour chaque opération, les commandes nécessaires en entrée et le type de données en sortie. Enfin, elle apporte un mécanisme qui identifie les caractéristiques des objets visibles pour l’utilisateur, les opérations applicables à un objet et les relations entre les objets ;
- 5. La couche Application [que l’on pourrait aussi appeler couche Actualisation] contient les programmes sur mesure qui analysent les objets de données (« Data Objects ») et présente le résultat de l’analyse de l’objet ou l’objet de données lui-même dans une forme que le consommateur de données (« Data Consumer ») peut comprendre.

Selon cette approche, Catherine Lupovici et Julien Masanès considèrent que l’objet numérique n’existe pas s’il n’est pas porteur des données sémantiques qui le rendent perceptible. Il en découlerait que les couches 1 à 3 du modèle d’information OAIS ne transforment pas l’objet numérique lui-même mais ses précurseurs binaires.

Cette même restriction se retrouve dans l’article Une structure de services pour objets numériques distribués de Robert Kahn et Robert Wilensky (A Framework for Distributed Digital Object Services). Ils y décrivent « les entités de base d’un système où l’information, sous forme d’objets numériques, est stockée, découverte, disséminée et gérée. [...] Nous insistons sur le fait qu’ici l’expression objet numérique est utilisée dans le sens technique d’une structure de données particulière et non dans le sens général de tout objet qui peut prendre une forme numérique. »

Les objets numériques structurels décrits dans cet article pourraient, selon ses auteurs, englober les objets numériques documentaires. Il semble plus juste de dire qu’ils possèdent des attributs et des méthodes communs puisqu’ils s’appuient sur la couche 4 du modèle OAIS et qu’ils visent à manipuler des collections d’objets numériques.

Des questions à affronter par l’expérience

Les définitions pragmatiques de l’objet numérique que donnent tous ces chercheurs sont acceptables parce qu’elles permettent de comprendre comment l’information est conservée, retrouvée et véhiculée jusqu’à l’utilisateur pour qu’il puisse interagir avec. Elles sont insuffisantes une fois l’objet numérique replacé dans le contexte de l’infosphère car :


- rendant mal compte des objets qui ne sont pas associés dans des collections -un texte stocké sur un disque dur, par exemple ;
- ignorant les objets qui n’ont pas pour destination d’être actualisés et ceux qui n’ont pas vocation à durer -un courrier électronique dans la mémoire d’un serveur de mails, par exemple ;
- s’intéressant aux objets numériques natifs surtout lorsqu’ils sont structurellement comparables aux reproductions numériques de substitution ;
- excluant les codes exécutables du champ d’étude alors qu’ils existent à tous les niveaux du modèle OAIS ;
- minorant la position du matériel -pourrait-il être constitutif de l’objet numérique ? ;
- n’explorant pas les limites -un bit, une variation de voltage dans un circuit, un domaine magnétique sur un disque dur sont-ils ou non des objets numériques ? ;
- ne fixant pas la relation entre objet numérique et énergie -sans énergie, un objet numérique existe-t-il ?

Le dispositif expérimental dénommé « la fontaine, objet numérique numéro 1 » devrait permettre de mieux cerner la notion d’objet numérique, sans prétendre répondre à l’ensemble de ces interrogations. La fontaine est un logiciel. C’est aussi un objet physique -un ordinateur, un écran, des enceintes, un clavier- pensé pour être placé dans un lieu public. Une séquence d’interaction avec la fontaine -répétée autant de fois que désiré- se déroule ainsi :


- l’utilisateur entre une adresse Internet (Universal Resource Locator) de son choix ;
- la fontaine prélève à cette adresse un flux de données, qui est reçu en local comme une succession de séquences binaires (couche 1 du modèle OAIS) mais les données lues par le logiciel comme un flux binaire (couche 2 du modèle OAIS) ;
- des informations de structure sont ajoutées au flux binaire pour en faire des données primaires adressables (couche 3 du modèle OAIS) ;
- les données primaires sont répliquées pour disposer de deux instances ;
- aux deux instances sont associées des données sémantiques différentes interprétables par le système d’exploitation et la couche applicative (couches 4 et 5 du modèle OAIS) : une instance est vue par le système comme un fichier graphique, l’autre comme un fichier sonore ;
- la fontaine actualise les deux instances en simultané, une image et sa bande-son.

L’expérience à laquelle convie « la fontaine, objet numérique numéro 1 » si elle est esthétique l’est incidemment. La fontaine n’a pas été pensée pour déverser "des belles images et de la belle musique".

La fontaine, machine illustrative

Le dispositif a été imaginé pour rendre sensible ce qui est normalement hors de portée de nos sens. Ce que la fontaine donne à percevoir, ce sont des échantillons pris dans le matériau binaire, des ensembles de bits ordonnés et structurés lus à la frontière de la matière. Ils contiennent les données, support logique de l’information, privés des éléments sémantiques nécessaires à sa reconnaissance. La fontaine ajoute les codes nécessaires à leur interprétation graphique et sonore -elle pourrait le faire sous d’autres formes : texte, chiffres, simulation 3D, etc.

Si l’on se cantonne aux définitions admises par les chercheurs en informatique, ce que nous percevons avec la fontaine n’est pas l’actualisation d’un objet numérique porteur de sens, même s’il en revêt l’apparence. De quoi s’agit-il alors ? Quelle est la nature de ce matériau binaire organisé que nous percevons par un artifice logiciel, et quel rapport entretient-il avec les objets numériques, sachant qu’il en est, partiellement, un élément constitutif ? Une autre hypothèse serait de considérer que la définition actuelle de l’objet numérique est incomplète. Elle pourrait s’étendre jusqu’à inclure toutes les formes auxquelles recourt le système technique pour conserver aux données de l’objet numérique le sens que perçoit celui qui interagit avec l’infosphère.

Une autre hypothèse encore serait que la compréhension du matériau binaire de l’infosphère ne nous est pas accessible dans ses détails. Que nous ne pouvons aborder qu’indirectement les phénomènes en cours à ce niveau primaires de manipulation des données. Se pose alors la question du degré d’autonomie qu’a acquis le matériau binaire au fur et à mesure de la constitution de l’infosphère.


Bibliographie

Eric Baptiste, L’infosphère : stratégies des médias et rôle de l’État, La Documentation Française, février 2000.

Olivier Blondeau et Florent Latrive, Libres enfants du savoir numérique, une anthologie du « Libre », éditions de l’éclat, mars 2000. Lyber disponible par le site de l’éditeur http://www.lyber-eclat.net/collections/secours.html#libres.

CCSDS, Layered Information Model, Recommendation for an Open Archival Information System reference model, Consultative Committee for Space Data Systems, janvier 2002. Texte en ligne : http://www.ccsds.org/documents/text/CCSDS-650.0-B-1.txt.

Gilles Gaston Granger, article Objet de l’Encyclopædia Universalis, édition numérique 2001.

Robert Kahn et Robert Wilensky, A Framework for Distributed Digital Object Services, the Corporation for National Research Initiatives (Virginia, USA), 13 mai 1995. Texte en ligne : http://www.cnri.reston.va.us/cstr/arch/k-w.html.

Derrick de Kerckhove, L’intelligence des réseaux, Éditions Odile Jacob, octobre 2000.

David M. Lévy, Where’s Waldo ? Reflections on Copies and Authenticity in a Digital Environment, extrait de Authenticity in a Digital Environment, Council on Library and Information Resources (Whashington DC, USA), mai 2000. Texte en ligne : http://www.clir.org/pubs/reports/pub92/levy.html.

Pierre Lévy, Cyberculture, rapport au Conseil de l’Europe, Éditions Odile Jacob, novembre 1997.

Catherine Lupovici et Julien Masanès, Metadata, for the long term preservation of electronic publications, Nedlib Report Series 2, Koninklijke Bibliotheek, 2000. Texte en ligne : http://www.kb.nl/coop/nedlib/results/NEDLIBmetadata.pdf.

John Maeda, Maeda@Media, Rizzoli International Editions (NYC, USA), 2000.

Nathan Shedroff, experience design, a manifesto for the creation of experiences, New Riders (Indiana, USA), mars 2001.

SPIP | squelette | | Plan du site | Suivre la vie du site RSS 2.0