Sommaire
Hommage
à R. Ginouvès
  Articles
 

René Ginouvès
"Des banques de données pour l'archéologie ?"
in : Traitement de l'information en archéologie
Brises (CNRS)
15, 1990, p. 97-107.

 
 

Résumé. - La multiplication des banques de données construites à l'échelle du chercheur ou du petit groupe favorise-t-elle la construction de systèmes généraux d'analyse, la transformation de nos mœurs documentaires, et en définitive l'efficacité de la recherche ? La conjonction, souhaitable, de travaux d'ordres divers implique une réflexion préalable sur les exigences de compatibilité, le découpage des champs de la recherche, la richesse documentaire des banques de données et d'images.
Mots clés. - Banques de données, systèmes d'information, compatibilité, archéologie.

On ne s'étonnera pas trop qu'une telle question soit posée par le chercheur qui, en 1971, proposait dans un article la création de banques de données pour l'ensemble de notre discipline[1]. Certes, si l'on considère la situation en 1990, où le plus petit de nos laboratoires a à sa disposition au moins un ordinateur, et où la plupart des chercheurs utilisent cet appareil pour leur travail quotidien, on pourrait imaginer que les vœux d'il y a vingt ans, alors considérés par l'ensemble de notre communauté scientifique comme utopiques, sont désormais réalisés, et que la question ne se pose plus de savoir s'il faut créer des banques de données en archéologie, puisque tellement d'archéologues en créent. Et pourtant, l'examen de la situation actuelle invite à bien autre chose qu'au triomphalisme ou à l'autosatisfaction.

Et d'abord parce que certains attendaient de l'introduction de l'informatique en archéologie, en plus des bénéfices pratiques sur lesquels je reviendrai, d'abord un certain nombre de bénéfices intellectuels et moraux. Bénéfice intellectuel d'abord en ce sens qu'on imaginait que cette informatisation contribuerait au mouvement tendant à rapprocher nos sciences de la culture des sciences de la nature[2] : non pas, certes, que l'utilisation de la machine soit en elle-même une garantie de scientificité, la proposition est si évidente qu'on n'a jamais explicitement soutenu l'idée contraire – mais ne peut-on parfois la pressentir, plus ou moins latente, dans l'esprit de ceux qui encore s'enorgueillissent de se servir d'un ordinateur? Pourtant même la plus puissante machine, mettant en œuvre l'algorithme le plus sophistiqué, ne garantit pas la pertinence du résultat d'un calcul de classification ; et, sur un tout autre plan, une description n'est pas, si elle a été enregistrée avec un traitement de texte, nécessairement meilleure que si elle l'avait été avec une plume d'oie. Peut-être faudrait-il au moins reconnaître que la plume d'oie, qui permet (du moins je le suppose), les mêmes inflexions de l'écriture que les plumes “ Sergent-major ” de mon enfance, convient mieux à l'individualisme d'une description de type traditionnel, alors que le traitement de texte, mécanisant la présentation du document plus encore que la “ machine à écrire ”, s'accorde mieux avec une analyse impersonnelle et dépouillée.

Mais nos prétentions et nos espoirs d'il y a vingt ans ne se situaient évidemment pas à ce niveau matériel de la technologie : comme il s'agissait alors, dans notre ambition, de construire des banques de données générales, utilisables par l'ensemble de la collectivité scientifique à l'image des corpus traditionnels, on insistait sur le fait que la mécanisation implique une parfaite régularité de la description, et donc l'établissement, préalable à toute réalisation pratique de banque documentaire, de règles suffisamment précises pour que les termes de l'interrogation puissent coïncider avec ceux de l'enregistrement ; c'est dire que nous proposions de mettre au point d'abord, en rapport avec l'utilisation prévue d'une banque, un système de “ constitution de données ”[3], prévoyant la définition et les limites du corpus envisagé, le choix de l'unité de description, les formules de segmentation des documents, l'expression de leur structure, le type des caractérisations et la manière de les exprimer, etc. Un livre fut publié qui présentait ces problèmes et un certain nombre de perspectives envisageables alors pour l'archéologie classique[4] ; et la construction des systèmes descriptifs, permettant de donner sa régularité à la transposition verbale du document matériel, a effectivement suscité des séries de publications[5] ; elle se poursuit dans notre propre laboratoire[6], le plus souvent en liaison avec le travail de conception de banques de données documentaires. Mais, dans la masse impressionnante des banques dont la création est annoncée, quelle proportion trouverait-on d'entreprises pour lesquelles, après en avoir explicité la finalité, on a construit un système descriptif complet et cohérent accordé à cette finalité ? Ce que l'on constate plutôt, du moins dans un certain nombre de cas, c'est l'improvisation, les errances, les repentirs, qui parfois aboutissent au découragement et à l'abandon. Et surtout les systèmes de description mis en œuvre, même partiels, même imparfaits, sont alors réservés à un individu ou à une petite communauté, ils ne contribuent guère à une organisation globale du travail.

Et c'est ici qu'interviennent de nouveaux regrets, portant cette fois sur les bénéfices moraux que nous pensions, bien naïvement, pouvoir retirer de l'introduction de l'informatique dans nos disciplines. Il nous semblait que la mise en place de grandes entreprises allait nous inciter à dépasser nos égoïsmes personnels, au moins dans le domaine de la documentation ; au lieu de la récolte individuelle du renseignement, jalousement gardé des regards indiscrets, et conservé pour être brandi comme une arme au moment opportun, nous imaginions une collaboration aussi large que possible pour réaliser des instruments d'information communs à toute une communauté scientifique, si bien que le chercheur, qui aurait fait don à la collectivité d'une part de son travail (celle que de toute manière il consacre nécessairement à sa recherche documentaire personnelle), aurait bénéficié en échange du travail de tous, et aurait été ainsi conduit – bénéfice complémentaire – à orienter ses efforts moins vers l'accumulation documentaire (accordée à tous par la machine) que vers la réflexion interprétative. Ces espoirs se sont révélés vains, malgré un certain nombre de tentatives[7], pour des raisons qu'il n'est pas utile d'expliciter ici, et qui tiennent à la fois à la faiblesse du pilotage institutionnel de la recherche, et à nos propres faiblesses individuelles de chercheurs, incapables de dépasser notre individualisme.

Le résultat, on le constate chaque jour plus clairement, et ici on peut enfin poser la question fondamentale de l'efficacité des banques de données : c'est un émiettement du travail, à travers les entreprises à taille individuelle que permet la micro-informatique, des redoublements coûteux d'efforts, la construction de banques trop étroites pour être réellement utiles sinon à un individu ou à un groupe réduit, dont la durée est incertaine, et qu'il ne sera jamais possible d'accorder. Même des banques institutionnelles, si elles n'atteignent pas un certain seuil de généralité, risquent de constituer plutôt une gêne qu'une aide pour la recherche, on l'a fait remarquer aussi pour d'autres domaines que l'archéologie. Et le plus grave en l'affaire, c'est que la bonne volonté ne suffit pas, ni la volonté affichée de rechercher la compatibilité. On a pu montrer[8] à quelles difficultés, pratiques et aussi théoriques, se heurte cette volonté, aussi bien en ce qui concerne la nature des données, la forme de leur analyse, et les contraintes des logiciels qui les exploitent ; de toute manière les ponts, s'il doit y en avoir entre les diverses banques, doivent avoir été préparés dès l'origine du travail ; de même on a pu montrer que, si l'on veut utiliser les mêmes données à la fois pour l'exploitation d'une banque documentaire et pour l'édition de catalogues ou d'index, il faut avoir prévu dès l'origine cette double finalité[9]. Une fois toutes ces précautions prises, suffirait-il de faire appel à la nouvelle technologie, en remarquant que désormais, après la mode des petites machines individuelles, vient celle des “ stations de travail ” reliées en réseau, qui effectivement offrent des solutions techniques à la circulation matérielle des données ? Il pourrait sembler qu'effectivement nous disposons désormais, avec ce type d'installation, d'un moyen permettant de concilier les charmes vénéneux du travail individuel avec l'efficacité (mais est-elle notre première priorité ?) de l'entreprise collective. Mais, en fait ces facilités matérielles ne deviennent intéressantes que si les problèmes de fond concernant la compatibilité des données et des systèmes ont déjà été réglés. Ici se rencontrent un certain nombre de contraintes, dont on peut au moins évoquer quelques-unes.

Et d'abord celles qui tiennent au découpage de notre domaine de recherche. Si les archéologues travaillant sur un chantier estiment avantageux d'enregistrer sur machine, et non plus sur fichier manuel, leurs découvertes quotidiennes, il peut être encore plus avantageux de prévoir que la banque ainsi créée sera réutilisée par son intégration dans un système plus général, lié par exemple à un organisme qui contrôle toute une série de fouilles dans le même pays[10]. Le découpage, géographique au niveau inférieur (celui du chantier), peut alors devenir thématique au niveau suivant, et l'on peut imaginer par exemple que l'analyse d'une monnaie trouvée sur le chantier de Thasos à une certaine date dans un certain complexe, analyse appartenant à l'ensemble de celles du complexe, sera transférée dans une banque de données documentaires générale portant sur les monnaies de Thasos. L'analyse devrait d'ailleurs être enrichie lors de ce transfert, par exemple de données bibliographiques dont les fouilleurs ne peuvent disposer sur le chantier; mais il est évidemment indispensable que la première analyse présente un dénominateur commun minimum avec celle qui doit suivre. Une telle démarche (qu'on peut transposer par la pensée aux autres domaines de la recherche) semble en mesure de favoriser la construction de banques de données du type des grands corpus traditionnels, à partir de banques restreintes en volume et variées en contenu.

Encore faudrait-il que la répartition des banques de données générales soit fixée, à l'intérieur au moins du cadre dans lequel le travail doit être organisé. Prenons par exemple le domaine de l'architecture : si on s'intéresse à un chapiteau ionique découvert dans un portique, on peut juger qu'il trouvera sa place dans une banque de données sur les portiques ; mais on connaît aussi des chapiteaux ioniques dans bien d'autres types de bâtiments. Si bien qu'on est amené à concevoir une double organisation des banques ou des fichiers, certains portant sur les types de bâtiments (portiques, temples, ... ), d'autres sur les éléments formels de leur construction (colonnes, murs, ...) ; et, comme chaque réalité matérielle se trouve située à la rencontre des deux systèmes (il s'agit du mur d'un temple), il faut décider de la répartition de l'information la concernant. Car dans la pratique il serait peu efficace de construire des banques sur les types de bâtiments en leur confiant, pour chaque document, toute l'information sur tous ses éléments formels (c'est ce que fait la publication architecturale traditionnelle, mais normalement pour un seul édifice, ou un nombre très limité)[11] ; cette information pourrait être confiée à une autre série de banques, qui elles porteraient sur ces éléments formels, cette fois considérés (relativement) indépendamment des types de bâtiments auxquels ils appartiennent, et, bien entendu, des passerelles permettraient de circuler entre les deux séries. De même, la diversité des points de vue devrait permettre de créer des séries indépendantes et complémentaires de banques, par exemple pour la céramologie, car il parait utile de considérer ensemble toutes les formes de vases appartenant à un certain ensemble culturel, qu'ils comportent ou non une iconographie , mais, si iconographie il y a, elle trouvera mieux sa place dans une banque enregistrant, en même temps que celle de la céramique, celle des autres formes de la création ; ici encore, le découpage des systèmes informatisés parait devoir s'écarter du découpage des publications traditionnelles, où un corpus de céramique par exemple comme le CVA (le Corpus Vasorum Antiquorum) prend en compte à la fois les formes et les décors figurés (et autres, qui pourraient faire l'objet d'encore une autre série de banques). La justification du type de découpage proposé ici tient à des raisons pratiques, concernant à la fois la réalisation des banques (éviter d'avoir à enregistrer, pour chaque document, une masse excessive d'informations) et leur consultation (car il est peu vraisemblable qu'un chercheur interrogeant une banque, dans une perspective comparative, sur les plans d'un portique sera intéressé en même temps par le détail de ses chapiteaux ; ou que celui qui cherche telle ou telle divinité sur les flancs des vases sera intéressé en même temps par la disposition de leurs anses).

Cette distribution du contenu des banques supposée une fois mise au point, il reste en tout cas à décider de leur contenu maximum (pour ce qui concerne la banque documentaire générale de type corpus, et non les banques particulières dont elle tire éventuellement une partie de son information, et pour lesquelles la justification de la richesse documentaire peut être chaque fois différente, en raison de la diversité de leurs cibles). Le propre du corpus, publié ou informatique, c'est qu'il doit être prévu pour une utilisation générale, et alors se pose le problème de sa richesse : nous avions proposé[12] d'enregistrer la totalité des caractéristiques dont se sert habituellement l'archéologue dans ses raisonnements interprétatifs, avec en plus des caractéristiques dont on ne se sert guère directement mais qui permettent de prendre une vue plus précise du document[13], et en plus des caractéristiques dont on peut penser qu'elles seront quelque jour utilisées. Cette formule a suscité à juste titre la critique[14], essentiellement parce qu'elle aboutit à donner de chaque document une description au moins aussi riche que celle des publications traditionnelles, et en pratique nettement plus riche[15], ce qui non seulement gonfle la masse des données enregistrées, mais aussi oblige à établir des règles d'analyse d'autant plus complexes que l'information est plus fine, et dont le volume risque de décourager celui qui veut utiliser la base en profitant réellement de sa qualité[16] ; et il est vrai aussi que la volonté d'enregistrer des informations comme celles qui concernent la structure du document implique l'emploi de systèmes plus lourds, dont l'utilisation est nécessairement plus difficile[17]. Cela veut-il dire que l'analyse mise en mémoire devrait être nécessairement sommaire ? Peut-être convient-il ici d'imaginer une série continue, à l'intérieur de laquelle pourraient se situer les diverses entreprises, et dont un terme serait la “ banque-index ” alors que l'autre serait la “ banque-corpus ” : cette dernière serait supposée enregistrer la totalité de l'information utilisable, alors que la banque-index permettrait seulement de retrouver les documents répondant à une interrogation simple, et dont on trouverait la description enregistrée dans une publication traditionnelle ou sur un quelconque autre support. Mais il est trop évident que dans la pratique toute banque participe à la fois à ces deux fonctions, la plus élémentaire comportant nécessairement de l'information, celle qui permet de faire les tris minimaux, et la plus riche ne pouvant contenir la totalité de l'information[18]. C'est pourquoi on pourrait penser à organiser des ensembles complexes, en raccrochant, à des banques très larges et légères, des banques plus “pointues ”, créées par des spécialistes dans une perspective particulière.

Enfin, il est trop évident que la finesse de la banque de données doit être fixée en tenant compte aussi de son illustration, et du caractère de cette illustration (elle ne porte pas la même quantité d'information, ni du même type, s'il s'agit d'un croquis coté ou s'il s'agit d'une photographie artistique), et de la manière dont le chercheur va circuler entre la banque de données et la banque d'images, “ à la main ” s'il s'agit d'une simple collection de photographies ou de dessins, ou au moyen d'un système informatique capable de chercher les images d'un vidéodisque à partir du texte, les textes à partir des images[19], ou qu'il s'agisse d'un système d'hypermedia permettant de naviguer librement dans tous ces systèmes d'information.

Quand on a pris en considération l'ensemble de ces questions, et éventuellement un certain nombre d'autres, on peut commencer à se demander s'il convient de créer une banque de données.


Juillet 1990

[1] Cf. Ginouvès (R.), “ Archéographie, archéométrie, archéologie. Pour une informatique de l'archéologie gréco-romaine ”, dans Revue archéologique (RA), 1971, pp. 93-126 ; et aussi “ L'ordinateur au service de l'archéologie ”, dans Québec-Science, 10, 3, 1971, pp. 6-9 ; ou “ Informatique et archéologie ”, dans Bulletin de la société française d'égyptologie, 63, 1972, pp. 9-18. Le mérite d'avoir le premier proposé une mécanisation de l'information, dès avant la diffusion de l'informatique, revient à Jean-Claude Gardin qui aux temps de la “ mécanographie ” avait déjà instauré un Laboratoire d'analyse documentaire pour l'archéologie ; cf. par ex. Gardin (J.-C.), “ Problèmes de la documentation ”, dans Diogène, 11, 1955, pp. 107-124 et ci-dessous (5).
[2] L'intérêt pour une telle évolution se manifestait alors sous des formes diverses' parmi lesquelles on rappellera le développement de la “ nouvelle archéologie ”, aujourd'hui à peu près aussi oubliée que la “ nouvelle cuisine ” ou que le “ nouveau roman ”, mais qui a elle aussi marqué toute une génération, par ses fidèles autant que par ses détracteurs, cf. par ex. Courbin (P.), Qu'est-ce que l'archéologie ? Essai sur la nature de la recherche archéologique, Paris, 1982.
[3] L'expression était utilisée dans un appel d'offres lancé en 1974 par la DGRST (Délégation générale à la recherche scientifique et technique) dans le cadre de l'Action complémentaire coordonnée “ Informatique et sciences humaines ”.
[4] Cf. Ginouvès (R.), Guimier-Sorbets (A.-M.), La constitution des données en archéologie classique, CNRS, 1978. Ce petit livre (161 pages) constituait la réponse de notre laboratoire à l'appel d'offres évoqué à la note précédente.
[5] Il faut citer d'abord celles de Jean-Claude Gardin et son équipe, avec déjà en 1956 un Code pour l'analyse des ornements (révisé en 1973, publié en 1978 par le CNRS comme l'ensemble de la série), travaux poursuivis (je ne mentionne ici que ceux qui intéressent l'archéologie classique) avec la publication en 1975 par G. Le Rider d'un Code pour l'analyse des monnaies (1956, révisé 1973), en 1976 d'un Code pour l'analyse des formes de poteries par J.-C. Gardin (1956, révisé 1974), jusqu'à la publication en 1980, par M. R. Salomé, d'un Code pour l'analyse des représentations figurées sur les vases grecs (réalisé dès 1960). Ces “ codes ” ont eu une grande intluence, directe et indirecte, car ils ont donné lieu à de nombreuses adaptations ; pour une analyse de cette série dans la perspective de notre propre laboratoire, cf. Ginouvès (R.), Guimier-Sorbets (A.-M.), “ Les banques de données archéologiques, propositions et controverses ”, dans RA, 1979, pp. 87-118.
[6] Cf. pour l'architecture, le Dictionnaire méthodique de l'architecture grecque et romaine, de R. Ginouvès et R. Martin aidés par de nombreux collaborateurs : le tome I, Matériaux, techniques de construction, techniques et formes du décor, est paru en 1985 ; le tome II, Eléments constructifs : supports, couvertures, aménagements intérieurs, est à l'impression ; le tome III, sur les Volumes et compositions architecturales, en cours de rédaction. Dans le domaine de la céramologie, un volume que nous préparons avec Fr. Villard et un certain nombre de collaborateurs, Les formes des vases grecs. Principes d'analyse et vocabulaire multilingue, devrait paraître en 1991. Dans un autre domaine, le Centre de recherche sur la mosaïque a publié en 1985 un volume sur Le décor
géométrique de la mosaïque romaine, sous la signature de C. Balmelle et l'ensemble de l'équipe : il s'agit des compositions linéaires et de surface ; un second volume, sur les compositions centrées, est en préparation ; par ailleurs, A.-M. Guimier-Sorbets a rédigé le volume de règles permettant l'utilisation de sa banque de données sur “ La mosaïque dans le monde grec, des origines à la fin de l'époque hellénistique ”, et, pour toutes les banques dont elle assume la conception, elle prépare avec leurs responsables la mise au point du système d'analyse documentaire.
[7] Il serait injuste de ne pas nommer ici la plus ample et probablement la mieux pensée d'entre elles, celle que symbolise le terme RIDA (Réseau d'information et de documentation archéologiques) ; cf. à ce sujet, Demoule (J.-P.), “ Rapport sur le réseau bibliographique de pré- et protohistoire européenne ”, dans Le RIDA, EHESS, Paris, 1972. Pour les projets de construction d'une banque de bibliographie analytique sur l'archéologie, cf. Serge Cacaly dans Cacaly (S.) éd., Banques de données et sciences de l'Antiquité, Paris, 1986, pp. 9-11 et Losfeld (G.), “ Les banques de données bibliographiques en Antiquité classique ”, ibid, pp. 53-55.
[8] Cf. Guimier-Sorbets (A.-M.) Les bases de données en archéologie. Conception et mise en œuvre, Paris, 1990, sous presse.
[9] Cf. ibid.
[10] L'Ecole française d'Athènes, par exemple, met sur pied une telle organisation, qui devrait permettre de gérer plus efficacement non seulement la documentation primaire, directe, concernant les objets archéologiques trouvés sur ses nombreux chantiers, mais aussi la documentation secondaire, “ référentielle ”, les photographies, dessins, estampages, ... de ces objets.
[11] Et certaines publications analysent même successivement chaque partie, par exemple d'un bâtiment, et les parties des parties, en considérant chaque fois leur forme, leur construction, leur décor (par exemple pour un théâtre tout ce qui concerne la cavea, puis l'orchestra etc.). Mais une autre formule consiste à analyser d'abord l'ordonnance du bâtiment, et envisager ensuite les éléments de la construction (tous les murs' puis toutes les colonnades, ...) puis les décors (toutes les mosaïques, etc.).
[12] Cf . La constitution des données..., 1978, p. 26-27
[13] Il s’agit souvent, en architecture, d’indications chiffrées, autres que celles utilisées, ou susceptibles d’être utilisées pour des calculs de sériation ou de structuration.
[14] Cf. A.-M. Guimier-Sorbets, Les bases de données..., 1990.
[15] Car il faut, pour des raisons de régularité, donner au sujet de chaque document la totalité des informations prévues, alors que les publications traditionnelles font le plus souvent un choix, variable et selon des critères non explicités.
[16] Il est vrai qu'on peut prévoir des systèmes d'aide à la consultation, et à l'analyse, s'appuyant sur les techniques de l'intelligence artificielle, cf. Guimier-Sorbets, RIAO,...
[17] La structure de documents aussi variables que les mosaïques antiques, par exemple, se fait au mieux au moyen d'un logiciel comme SIGMINI, produit par l'Ecole des Mines de Paris pour prendre en compte des configurations qui ne peuvent être déclarées à l'avance. Le logiciel fonctionne aussi bien sur des gros systèmes que sur des minis et des micro-ordinateurs sous UNIX/XENIX.
[18] Ni sous la totalité de ses formes ; si l'on décide que, pour un escalier de trois marches, on va donner la hauteur et la profondeur de chacune, cela ne permettra pas à un système documentaire de retrouver les exemples où les trois marches sont de hauteur égale, ceux où la hauteur augmente vers le haut, ceux où la marche centrale est la plus haute, etc., toutes indications qu'on peut évidemment décider de fournir a priori au système, même sans lui indiquer les dimensions des marches.
[19] Sur le système PILOTE, conçu par A.-M. Guimier-Sorbets pour faciliter l'utilisation conjointe de ses banques de données et du vidéodisque “ Images de l'archéologie ”, cf Godot (N.), Guimier-Sorbets (A. M.), Mordini (P.), Interrogation simultanée de banques de données et d'images. Les possibilités offertes par SIGMINI, dans Actes d'IMACOM’88, 2e Salon international sur la vidéo interactive et ses applications, Besançon, 1988, 12 p. non paginées.

Haut de la page Retour à la liste des articles en ligne

© Archéologie et systèmes d'information, UMR 7041 ArScAn. Hommage à René Ginouvès (en ligne), 2003 (consulté le ...) <www.mae.u-paris10.fr/ginouves/index.html>