Hostname: page-component-77c89778f8-5wvtr Total loading time: 0 Render date: 2024-07-19T00:57:02.974Z Has data issue: false hasContentIssue false

Un essai de traitement sur ordinateur des documents diplomatiques du Moyen Age

Published online by Cambridge University Press:  11 October 2017

Lucie Fossier
Affiliation:
Attachée à la Section de Diplomatique de l'Institut de Recherche et d'Histoire des Textes. Chargée du traitement sur ordinateur des documents diplomatiques du Moyen Age (I.R.H.T.-C.R.A.L.).
Marion Créhange
Affiliation:
Institut Universitaire de Calcul Automatique de Nancy

Extract

Le traitement automatique de l'information a fait, depuis une dizaine d'années, de considérables progrès. Cependant, si les études théoriques qu'il a suscitées se multiplient, les applications ne suivent pas la même progression, tout au moins dans le domaine des Sciences humaines. Il n'en serait pas moins injuste d'ignorer les tentatives faites en France pour exploiter divers types de documentation : tout le monde connaît maintenant le nom de Jean-Claude Gardin, dont l'intrépidité est venue à bout de bien des réticences, et qui reste l'un des guides les plus sûrs et les plus clairs de la documentation automatique.

Type
Outillages
Copyright
Copyright © Les Éditions de l’EHESS 1970

Access options

Get access to the full version of this content by using one of the access options below. (Log in options will check for institutional or personal access. Content may require purchase if you do not have access.)

References

1. Si modestes soient les débuts de cette entreprise, je ne voudrais pas manquer de témoigner ici ma reconnaissance à ceux qui ont soutenu mes premiers efforts : M. J. Le Goff et M. E. Le Roy Ladurie, pour l'accueil bienveillant qu'ils nous ont réservé dans leur revue ; M. J. Glénisson, directeur de l'Institut de Recherche des Textes, pour la confiance qu'il m'a témoignée ; M. J. Monfrin, professeur à l'École des chartes, pour l'aide patiente qu'il ne m'a jamais refusée. Mes « compagnons habituels de travail » ne m'en voudront cependant pas, je l'espère, si j'attache un prix tout particulier à la sympathie spontanée que cette entreprise a suscitée chez les « scientifiques » de l'Institut Universitaire de Calcul Automatique de Nancy, en particulier Jacques André, Jean- Pierre Chamagne, et, bien entendu, Mme M. Créhange : l'exposé de la méthode d'exploitation, qu'elle a bien voulu faire ici, montre assez le rôle déterminant qu'elle a joué dans la réalisation d'un projet qui, sans elle, fût demeuré longtemps encore du domaine de l'hypothèse ; le souci constant chez elle d'éviter une systématisation qui eût privé de la souplesse requise le fonds documentaire traité, la nécessité pour moi de présenter, au cours de nos séances de travail, des problèmes précis et bien définis, ont rendu cette collaboration « interdisciplinaire » si profitable que je ne saurais la passer sous silence.

1. Parmi toutes les entreprises spécialisées dans une exploitation de ce type, citons plus particulièrement l'exemple du « Cédocar » (Centre de Documentation de l'Armée), qui applique à une documentation scientifique les principes énoncés ci-dessus, répond à des demandes occasionnelles mais publie également une bibliographie périodique. La compétence du personnel qui se consacre à cette tâche autant que la qualité du matériel utilisé en font un Centre de Documentation modèle que tout chercheur, intéressé par ce genre de problème, se doit de connaître

1. Daumard, A. et Furet, F., « Les Archives notariales et la mécanographie », dans Annales, E.S.C., 14e année, octobre-décembre 1959, n° 4, pp. 676693.Google Scholar

2. La mise au point en a été faite par Couturier, M., « Vers une nouvelle méthodologie mécanographique », dans Annales, E.S.C., 21e année, juillet-août 1966, n° 4, pp. 769778.Google Scholar

1. Précisons, toutefois, que le traitement sur ordinateur comporte ce premier niveau, un peu modifié ; et, qu'une fois l'exploitation mise en train, la carte mécanographique sera abandonnée.

1. On lira avec profit la mise au point très claire de ce problème faite par J.-Cl. Gardin, « L'utilisation de l'information sémantique en documentation automatique », dans Actes du premier colloque international de linguistique appliquée (Annales de l'Est, Mémoires (n° 31), pp. 110-123

1. On sait, en effet, quel goulot d'étranglement présente actuellement la perforation et le contrôle des textes introduits en mémoire.

2. Au demeurant, il serait indéfendable de négliger, dans une exploitation de ce genre, l'intérêt lexicographique des documents. Notre système prévoit un « troisième niveau », comprenant les termes utilisés dans l'acte et reliés aux concepts du « deuxième niveau ». Nous en avons remis à plus tard l'exploitation pour la raison suivante : dans le cadre du « Centre de Recherches et d'Applications linguistiques de Nancy » (C.R.A.L.), nous avons entrepris l'enregistrement des chartes originales antérieures au xne siècle, afin d'en étudier le vocabulaire ; ceci nous amènera assez rapidement à entreprendre l'analyse morphologique — automatique, bien entendu — de ces chartes, afin de pouvoir en constituer sans pertes excessives de temps les index verborum. Il nous semble mieux d'attendre les résultats de ce premier travail avant d'enregistrer notre troisième niveau, qu'une reconnaissance des formes rendra plus facile à exploiter.

3. Tout au moins en ce qui nous concerne, parce que ce que nous demandons à l'ordinateur, c'est une sélection de documents pertinents. Dans d'autres domaines, celui de la statistique par exemple, les bruits seraient tout aussi dangereux que les silences.

1. Nous n'insistons pas davantage sur les diverses constructions paradigmatiques mises au point jusqu'ici : elles ont été évoquées ailleurs avec plus de compétence ; la mise au point la plus complète et la plus récente est sans doute celle de Coyaud, M., Introduction à l'étude des langages documentaires. Paris, 1966, pp. 2277 Google Scholar ; on trouvera aussi des indications, plus succinctes, mais d'une grande clarté, dans Fouquet, , « Les langages documentaires ; modèle descriptif et problème fonmentaux », dans Symposium organisé par VInternational Computation Centre de Rome sur Symbolic Languages in Data Processing, Rome, 1962.Google Scholar

1. J. Cl. Gardin, op. cit., pp. 112-113.

2. Hallig, R. et Wartburg, W. Von, Système raisonné des concepts pour servir de base à la lexicographie, Berlin, 1963.Google Scholar

3. Avant même de nous référer au dictionnaire de Wartburg, nous avions conclu que, l'homme étant le centre même de notre documentation, nos classifications devaient refléter une Imago mundi dont il était le pivot. Nous l'avons imaginé d'abord statique, dans les « cadres de l'existence » (cadres géographiques et chronologiques ; cadres matériels ; cadres juridiques et sociaux ; cadres institutionnels) ; puis dynamique, exerçant son activité au sein de ces différents cadres (activités intellectuelles ; activités de production ; activité juridique et rapports sociaux ; charges et responsabilités administratives). Nous n'affirmons pas la valeur de ce classement, mais en existe-t-il d'incontestables ? Nous le répétons, les classifications sur ordinateur ne tirent leur valeur que de leur efficacité à l'exploitation : on peut donc bien difficilement les calquer les unes sur les autres ; si séduisante soit l'idée d'un lexique universel, il faut bien admettre que sa mise en pratique serait malaisée.

4. Cette structure en forme d'arbre suppose naturellement qu'une notion spécifique ne soit rattachée qu'à une seule notion générique ; elle interdit donc la multovicité du lexique : nous tenterons de remédier à cet inconvénient (cf. plus loin: « La Réalisation du système », 1.2.3, p. 264).

1. Ibid., ci-dessous p. 264.

2. Il faut, cependant, prévoir des aménagements à cette règle (cf. « La Réalisation du système » : pour reprendre l'exemple précédent, il n'est pas interdit, en effet, aux chercheurs de s'intéresser aux dîmes en fonction de « l'Organisation de l'Église ».

1. Op. cit.

2. Cette notion n'est pas parfaitement définie. La définir nous entraînerait trop loin et peutêtre dans un domaine peu fertile. Le souci permanent qui a présidé à l'établissement de cette relation a été la recherche de l'efficacité de l'outil qu'est le lexique.

1. Lorsque deux descripteurs ont exactement le même rôle vis-à-vis d'un ou plusieurs autres descripteurs, on les lie par une relation de « court-circuit » à un descripteur auxiliaire appelé « centre de branchement » ; c'est ce dernier qui est en relation avec le ou les autres descripteurs.

1. Ce que nous appelons noeud de couplage « correspondant à » un descripteur, c'est le premier noeud de couplage rencontré lorsqu'on remonte dans l'arbre-lexique à partir de ce descripteur (ce peut être le descripteur lui-même). Une liste des niveaux de couplage a été fournie au programme de réduction des relations.