JPA : Î de Science 2001
Île de Science 2001, le 20 mars 2001
Le document numérique : pratiques en mathématiques et en informatique
Jean-Paul Allouche (CNRS, LRI, Orsay)
Parmi les documents qu'utilise un chercheur, certains sont sous
forme papier (livres, articles dans des revues scientifiques,
preprints ...), d'autres sont sous forme électronique
ou numérique. Il y a enfin les "communications personnelles" qui
sont seulement des traces de conversations ou d'échanges de
courriels. On appelle traditionnellement "littérature grise" les
preprints mais on peut légitimement, comme le suggérait
G. Dubray, s'interroger sur le sort des notes, brouillons, et
autres fragments qui peuvent exister aussi sous forme
électronique ou numérique. Je propose d'appeler "littérature
gris-clair" ce qui entre dans cette dernière catégorie. Notons
qu'il faudrait en fait définir tout un camaïeu en considérant,
avant la chose officielle imprimée ou électronique, la littérature
grise, elle-même précédée par la littérature gris-clair, et
ainsi de suite jusqu'à ... l'angoisse de la page blanche. Examinons quelles
sont les pratiques des chercheurs, en particulier en mathématiques
ou en informatique, en face de ces différents types de documents.
La première source de littérature scientifique est constituée par les
articles parus dans des revues spécialisées. Ces articles sont
arbitrés par des pairs, leur contenu scientifique a donc été vérifié,
et la revue donne la date de soumission et la date de publication.
De telles revues peuvent être traditionnelles (revues imprimées)
ou électroniques, ou encore mixtes proposant à la fois une version
papier et une version numérique. Nous ne reviendrons pas ici sur
les dérapages des prix de ces revues (et pourtant il nous arrive
encore de croiser des collègues qui croient que les éditeurs
scientifiques perdent de l'argent sur les revues et les éditent
par pure philanthropie ...). Tout en respectant le travail des
éditeurs, remarquons seulement que les scientifiques sont à la
fois ceux qui produisent les articles (y compris le plus souvent au
sens matériel de la frappe scientifique), ceux qui arbitrent les
articles et ... ceux qui les lisent.
Comme le processus de publication d'un article est relativement
long (il n'est pas rare qu'il dure plusieurs années) il se produit
une circulation parallèle d'articles sous formes de "preprints".
Par courrier il y a encore 30 ans, puis par courriel, puis grâce
aux serveurs de "preprints" ou sur les pages des scientifiques sur
la toile. De tels articles (la littérature grise) n'ont pas été
arbitrés. L'apparition des serveurs de preprints et particulièrement
de http://arXiv.org/ représente une
étape intermédiaire : un article envoyé à un
tel serveur ne peut plus être complètement retiré, il peut être
modifié, mais les versions successives restent sur le serveur
pour éviter les contestations (d'antériorité par exemple).
Ceci a un effet dissusasif : on ne "jette" pas n'importe quoi sur
un tel serveur. L'évolution relativement récente est de pouvoir
laisser ces preprints sur le serveur même après publication
dans une revue, à condition de spécifier que la seule version qui
fait foi est celle de la revue, et de donner les références précises
de l'article publié. Mieux, on peut imaginer que les revues
scientifiques aillent "faire leur marché" sur ces serveurs pour y
choisir des articles de qualité qui auront la griffe du journal (après
la procédure d'évaluation et si celle-ci est positive naturellement).
À ce propos on lira avec intérêt l'article : "Une nouvelle
unité de service au CNRS : le CCSD, Centre pour la communication
scientifique directe", La Lettre SPM 36, février 2001, 4-5.
Pour terminer abordons la question de la littérature "gris clair"
(voire encore plus pâle). De plus en plus les brouillons sont
électroniques (tapés directement au clavier de son ordinateur
préféré et conservés dans le disque dur d'icelui). Mais on garde
aussi des courriels répondant de manière informelle à telle ou telle
question. Ou bien des bouts d'articles non utilisés ou à compléter.
Cette masse de documents numériques n'est guère répertoriée et peu
utilisable par d'autres que les gens qui les ont sur leur machine.
À vrai dire une question un peu dans la même optique est posée
depuis un certain temps pour les écrivains : s'il n'y a plus de brouillons
ou s'ils ne sont pas accessibles, comment pourra-t-on jamais savoir
leurs hésitations, corrections, remords et récritures ? On pourra
bien sûr aller voir l'exposition "Brouillons d'écrivains" jusqu'au
mois de juin à la Bibliothèque Nationale de France. Pour les brouillons
électroniques des écrivains on pourra se reporter au Figaro du
1er mars 2001 qui laisse la parole à Jacques Roubaud.
Après avoir expliqué comment un logiciel de maintenance de disque
dur lui a permis de retrouver des traces antérieures de certains
écrits, Roubaud indique "Le brouillon moderne sur ordinateur, strict
relevé chronologique, est plus sévère que son ancêtre". Cette phrase
peut nous inciter à la prudence pour l'éventuelle diffusion de tous
ces fragments que nous conservons sans même toujours nous en souvenir.
Pour terminer je voudrais indiquer une idée qui m'est venue en
préparant cette réunion. Tout le monde a entendu parler de
"Napster" et de la communauté mondiale des utilisateurs de ce
logiciel gratuit qui leur permet de partager quasi-instantanément tous
les fichiers musicaux (au format MP3) que n'importe lequel d'entre
eux possède à cet instant. L'industrie du disque, en avançant le
respect du droit d'auteur, s'est émue des pertes de revenus qu'elle
imaginait devoir subir. Naturellement d'autres logiciels
"peer to peer" ont déjà pris la relève ("Gnutella" par exemple).
Certains de ces logiciels (Napster) utilisent une sorte de table des
matières centralisée donc contrôlable par des agents économiques
soucieux de garder une sorte de monopole. D'autres (Gnutella)
n'ont pas cette particularité, les rendant très difficiles à
verrouiller. Le lecteur pourra trouver plus de détails sur la
page
P2P de "Wired" (http://www.wired.com/wired/archive/8.10/p2p_pages.html).
Ce que les amoureux de la musique ont fait, les scientifiques ne
pourraient-ils pas le réaliser aussi ?