JPA : Î de Science 2001 Île de Science 2001, le 20 mars 2001

Le document numérique : pratiques en mathématiques et en informatique

Jean-Paul Allouche (CNRS, LRI, Orsay)

Parmi les documents qu'utilise un chercheur, certains sont sous forme papier (livres, articles dans des revues scientifiques, preprints ...), d'autres sont sous forme électronique ou numérique. Il y a enfin les "communications personnelles" qui sont seulement des traces de conversations ou d'échanges de courriels. On appelle traditionnellement "littérature grise" les preprints mais on peut légitimement, comme le suggérait G. Dubray, s'interroger sur le sort des notes, brouillons, et autres fragments qui peuvent exister aussi sous forme électronique ou numérique. Je propose d'appeler "littérature gris-clair" ce qui entre dans cette dernière catégorie. Notons qu'il faudrait en fait définir tout un camaïeu en considérant, avant la chose officielle imprimée ou électronique, la littérature grise, elle-même précédée par la littérature gris-clair, et ainsi de suite jusqu'à ... l'angoisse de la page blanche. Examinons quelles sont les pratiques des chercheurs, en particulier en mathématiques ou en informatique, en face de ces différents types de documents.

La première source de littérature scientifique est constituée par les articles parus dans des revues spécialisées. Ces articles sont arbitrés par des pairs, leur contenu scientifique a donc été vérifié, et la revue donne la date de soumission et la date de publication. De telles revues peuvent être traditionnelles (revues imprimées) ou électroniques, ou encore mixtes proposant à la fois une version papier et une version numérique. Nous ne reviendrons pas ici sur les dérapages des prix de ces revues (et pourtant il nous arrive encore de croiser des collègues qui croient que les éditeurs scientifiques perdent de l'argent sur les revues et les éditent par pure philanthropie ...). Tout en respectant le travail des éditeurs, remarquons seulement que les scientifiques sont à la fois ceux qui produisent les articles (y compris le plus souvent au sens matériel de la frappe scientifique), ceux qui arbitrent les articles et ... ceux qui les lisent.

Comme le processus de publication d'un article est relativement long (il n'est pas rare qu'il dure plusieurs années) il se produit une circulation parallèle d'articles sous formes de "preprints". Par courrier il y a encore 30 ans, puis par courriel, puis grâce aux serveurs de "preprints" ou sur les pages des scientifiques sur la toile. De tels articles (la littérature grise) n'ont pas été arbitrés. L'apparition des serveurs de preprints et particulièrement de http://arXiv.org/ représente une étape intermédiaire : un article envoyé à un tel serveur ne peut plus être complètement retiré, il peut être modifié, mais les versions successives restent sur le serveur pour éviter les contestations (d'antériorité par exemple). Ceci a un effet dissusasif : on ne "jette" pas n'importe quoi sur un tel serveur. L'évolution relativement récente est de pouvoir laisser ces preprints sur le serveur même après publication dans une revue, à condition de spécifier que la seule version qui fait foi est celle de la revue, et de donner les références précises de l'article publié. Mieux, on peut imaginer que les revues scientifiques aillent "faire leur marché" sur ces serveurs pour y choisir des articles de qualité qui auront la griffe du journal (après la procédure d'évaluation et si celle-ci est positive naturellement). À ce propos on lira avec intérêt l'article : "Une nouvelle unité de service au CNRS : le CCSD, Centre pour la communication scientifique directe", La Lettre SPM 36, février 2001, 4-5.

Pour terminer abordons la question de la littérature "gris clair" (voire encore plus pâle). De plus en plus les brouillons sont électroniques (tapés directement au clavier de son ordinateur préféré et conservés dans le disque dur d'icelui). Mais on garde aussi des courriels répondant de manière informelle à telle ou telle question. Ou bien des bouts d'articles non utilisés ou à compléter. Cette masse de documents numériques n'est guère répertoriée et peu utilisable par d'autres que les gens qui les ont sur leur machine. À vrai dire une question un peu dans la même optique est posée depuis un certain temps pour les écrivains : s'il n'y a plus de brouillons ou s'ils ne sont pas accessibles, comment pourra-t-on jamais savoir leurs hésitations, corrections, remords et récritures ? On pourra bien sûr aller voir l'exposition "Brouillons d'écrivains" jusqu'au mois de juin à la Bibliothèque Nationale de France. Pour les brouillons électroniques des écrivains on pourra se reporter au Figaro du 1er mars 2001 qui laisse la parole à Jacques Roubaud. Après avoir expliqué comment un logiciel de maintenance de disque dur lui a permis de retrouver des traces antérieures de certains écrits, Roubaud indique "Le brouillon moderne sur ordinateur, strict relevé chronologique, est plus sévère que son ancêtre". Cette phrase peut nous inciter à la prudence pour l'éventuelle diffusion de tous ces fragments que nous conservons sans même toujours nous en souvenir.

Pour terminer je voudrais indiquer une idée qui m'est venue en préparant cette réunion. Tout le monde a entendu parler de "Napster" et de la communauté mondiale des utilisateurs de ce logiciel gratuit qui leur permet de partager quasi-instantanément tous les fichiers musicaux (au format MP3) que n'importe lequel d'entre eux possède à cet instant. L'industrie du disque, en avançant le respect du droit d'auteur, s'est émue des pertes de revenus qu'elle imaginait devoir subir. Naturellement d'autres logiciels "peer to peer" ont déjà pris la relève ("Gnutella" par exemple). Certains de ces logiciels (Napster) utilisent une sorte de table des matières centralisée donc contrôlable par des agents économiques soucieux de garder une sorte de monopole. D'autres (Gnutella) n'ont pas cette particularité, les rendant très difficiles à verrouiller. Le lecteur pourra trouver plus de détails sur la page P2P de "Wired" (http://www.wired.com/wired/archive/8.10/p2p_pages.html). Ce que les amoureux de la musique ont fait, les scientifiques ne pourraient-ils pas le réaliser aussi ?