mardi 16 octobre 2012

ETANOT et EAC

La base ETANOT sur le site des Archives nationales en 2012


ETANOT est une base des Archives nationales (AN) qui donne la liste des notaires parisiens depuis le XVe siècle environ jusqu’à nos jours, même si de nos jours, on le sait, le Minutier central ne conserve pas encore leurs archives.

Chaque notaire y a fait l’objet d’une notice (environ 3300 notices) qui donne son identité, ses dates d’exercice, l’étude dans laquelle il exerce ou il a exercé (aujourd’hui plus de 130 études mais seules 122 sont répertoriés), son adresse, sa localisation, des éléments de biographie si on les connaît (la sous-série BB/10 ministère de la Justice, Notaires, conservés aux Archives nationales, nous donne ces informations), et évidemment les archives qu’il a produites, etc.
Ces informations ressemblent beaucoup à celles trouvées dans les normes de description archivistique: ISAD(G) et ISAAR(CPF)…beaucoup plus dans cette dernière puisque l'objectif d'ISAAR(CPF) était la rédaction de notices d’autorité offrant une description détaillée des entités Collectivités, Personnes et/ou Familles permettant d'élaborer des notices dans lesquelles la forme du nom du producteur d'archives est normalisée pour constituer un point d'accès, et où sont données ses caractéristiques essentielles pour pouvoir replacer ses archives dans leur contexte de production, aujourd’hui et aussi dans le futur (en 2013 il est prévu que les notaires versent leurs minutes aux AN)…

Un petit mot sur la norme internationale sur les notices d'autorité ISAAR(CPF) publiée en 1996 par le Conseil international des archives (ICA) puis révisée en 2004 (on a constaté en effet que si la norme de description ISAD(G) permettait de décrire des notices d'autorité dans sa zone du contexte (zone 3.2), celles ci étaient tout de même assez sommaires)...

On prévoit d’ici 2013 de migrer la base ETANOT vers le nouveau système informatique (SIA/SIV) des AN, plus précisément dans le référentiel producteur. L’occasion pour moi donc, de revenir sur la genèse de cette innovante base imaginée et conçue dès 2004 par une géniale archiviste, alors responsable du service informatique des AN. Une vraie cyber-archiviste très visionnaire pour l’époque. Bravo à elle.

Dans les formations que je dispense, je donne souvent l’exemple de cette base pour illustrer ISAAR(CPF) et EAC, ce que je compte faire dans ce billet.

Mais d’abord, quelques aspects techniques de ETANOT : les notices proviennent d’une fort ancienne base de données documentaire alimentée et à tenue à jour régulièrement par le personnel du Minutier central depuis les années 1990. Cette base a été complétée par d’autres apports pour lesquels je ne rentre pas trop en détail, notamment l'outil informatisé d’orientation dans les fonds du Minutier central appelé Noemi pour NOtaire MInutes, lancé en 1995 mais qui n’a pu être mené à son terme, etc.

C’est cette base (type séquentielle indexée, et donc Cindoc pour ne pas la nommer, et donc pas du tout relationnelle) qui a été convertie d’un format texte structuré vers le format XML grâce à un programme XSLT sur mesure ! …seule une cyber-archiviste pouvait imaginer tel traitement…et c’était déjà en 2004.
Comme vous le savez, XSLT permet de restructurer les données, de les enrichir et de créer une instance XML complètement différente de celle d’origine. Ce qui s’est passé pour cette migration pour laquelle divers traitements ont structuré les données, des éléments d'indexation ont également été rajoutés pour enfin, aboutir à une instance XML conforme à la DTD Encoded Archival Context (EAC) version 2004, publiée et aujourd'hui consultable en ligne sur le site des AN et donc du ministère de la Culture.

ETANOT sera migrée dans le référentiel producteur du SIA (le nouveau système informatique des AN) en 2013. On pourra alors, depuis une notice d'autorité, pouvoir atteindre par simple clic un répertoire produit par le notaire ainsi qu’à toutes ses images numériques (rappelons qu’un répertoire est un registre établi par le notaire, où sont relevés dans l’ordre chronologique tous les actes passés dans une étude en indiquant essentiellement la date, la nature de l’acte et les noms des principales parties concernées, cette base existe, il s’agit de la base ETAREP, consultable sur le même site mais d’une manière indépendante pour le moment à cette adresse).

Bon, revenons maintenant à ce pour lequel j’ai rédigé ce billet : les équivalences des zones d'ISAAR(CPF) dans EAC en prenant pour exemple la base ETANOT.

Liste des notaires de l'étude XXIX
(mention obligatoire : notice extraite de l'application ETANOT, pour toute diffusion publique ou exploitation commerciale, une autorisation préalable est à demander aux Archives nationales)

S’il n'existe pas de correspondance stricte (élément à élément) entre ISAAR(CPF) et l’EAC, on peut toutefois faire correspondre certains éléments de la norme à des éléments spécifiques de la DTD (où on y trouve l'intégralité des éléments d'ISAAR(CPF)).

Déjà, voyons l’élément racine obligatoire qui signale une nouvelle instance, elle se subdivise en deux éléments qui ne correspondent en rien aux deux sections 5 et 6 (5 Éléments d'une notice d'autorité et 6 Relations entre les collectivités, les personnes et les familles, et des ressources archivistiques ou autres). Ces deux éléments correspondent en fait à la Zone du contrôle 5.4 et, ici "description du notaire", qui regroupe les informations de 5.1 à 5.3...bon, c'est un peu alambiqué comme système mais on s'y retrouve ensuite lorsque l'instance est publiée et mise en ligne.

Ensuite seuls 4 éléments sont obligatoires dans ISAAR (CPF) [Type d’entité, Nom, Date, Numéro] et tous figurent dans ETANOT, sauf le premier, implicite, qui est 5.1.1. Type d’entité = P (personne). Les 3 autres sont 5.1.2 Forme autorisée du nom = ici Nom du notaire, 5.2.1 Date d’existence du producteur = ici Dates d’exercice et 5.4.1 Code d’identification notice = Numéro de notice (exemple FRDAFANCH00MC_NANOTAIRE03027).



Nom du notaire=5.1.2 Forme autorisée du nom
Dates d’exercice=5.2.1 Date d’existence du producteur
 Numéro de notice=5.4.1 Code d’identification notice
etc.
(mention obligatoire : notice extraite de l'application ETANOT, pour toute diffusion publique ou exploitation commerciale, une autorisation préalable est à demander aux Archives nationales)


Voyons à présent la reprise zone par zone en commençant par la Zone d’identification. On trouve 5.1.5 Autres formes du nom = Autre(s) forme(s) du nom (Formes parallèles du nom (5.1.3) n’a pas été utilisé de même que  Formes du nom normalisées selon d’autres conventions (5.1.4) ainsi que, et ça se comprend, le Numéro d’immatriculation des collectivités (5.1.6).

5.2.2 Histoire = ici Informations biographiques qui se retrouve autant que faire se peut, dans un grand nombre de notices (informations glanés ça et là dans les almanachs, bulletins officiels, tables des lois, etc. et notamment en BB/10).

5.2.3 Lieux = ici Adresse(s) professionnelle(s), se retrouve partout (exemple : rue de la Ferronnerie de 1776 à 1782, rue Croix-des-Petits-Champs de 1783 à l’an II) et une particularité est que «Paris» est implicite sauf mention contraire.

5.2.4 Statut juridique n’a pas été retenu dans ETANOT (aujourd’hui cela pourra poser un problème car comment donner l’information sur un notaire dépendant hiérarchiquement d'un autre «producteur» doté d’une personnalité morale, quel statut juridique pourra être retenu pour une «Société de notaires» par exemple ?)…j’ose imaginer et espérer, mais je n’ai aucune vision future de la V2 du SIA/SIV, que celle ci nous donnera la possibilité de le renseigner et de l’encoder.

5.2.5 Fonctions et activités non plus n’a pas été retenu dans ETANOT parce que implicite (il faudrait en effet mettre partout «Notaire»…).

5.2.6 Textes de référence : on aurait pu y mettre les informations des lettres de provision d’office, des décrets, des arrêtés de nomination, etc. mais en réalité on les retrouve dans 5.2.2 Histoire vu plus haut.

5.2.7 Organisation interne/généalogie, non retenu car il s’agit évidemment de Collectivités/Familles.

5.2.8 Contexte général : figure en introduction sur la page d’accueil du site, donc inutile de le répéter systématiquement.

Poursuivons notre reprise zone par zone et intéressons-nous au Type de relation qui, rappelons-le peut être chronologique, hiérarchique, d’association, d’appartenance (à une famille). Dans ETANOT, le type de relation est implicite sur le plan de la relation chronologique (on sait que tel notaire a eu pour prédécesseur untel et successeur un autre grâce aux noms qui s’affichent chronologiquement sous le numéro de l’étude concernée).

Pour ce qui concerne 5.4.2. Code d’identification du ou des services qui ont élaboré la notice d’autorité , le terme générique «Minutier central» est implicite.

5.4.3. Règles ou conventions suivies est indiqué sur la page introductive.

5.4.4. Niveau d’élaboration (projet, notice validée, révisée, détruite) : «notice validée» est implicite dans ETANOT…on aurait pu prévoir d’autres choix (la V2 du SIA/SIV donnera-t-elle la possibilité de l’encoder ?).

Enfin la Zone du contrôle.
5.4.5. Niveau de détail (élémentaire, moyen ou complet) : cette information manque également dans ETANOT mais comme la norme ISAAR (CPF) prévoit qu’une notice peut être élémentaire, moyenne ou complète, les niveaux «élémentaire» et «complet» étant définis par la norme, le niveau «moyen» est laissé à l'appréciation des utilisateurs, on peut supposer que le niveau est «complet» puisqu’à l’exception de Statut juridique, un bon nombre de champs est renseigné comme les Histoire, Lieux, Fonctions et activités, Textes de référence et Sources, etc.

5.4.6. Date(s) de création, de révision ou de destruction : manque dans ETANOT.

5.4.8. Sources : ces informations figurent dans «Autres documents connus relatifs au notaire» et dans «Éléments de bibliographie», mais il y a déjà beaucoup d’informations à ce sujet dans les pages d’introduction sur le site.

5.4.9. Notes relatives à la mise à jour de la notice : le nom de l’auteur de la notice ne figure pas dans ETANOT mais seulement dans la base de données à plat dont j’ai dit quelques mots plus haut.
Bon voilà tout. Ça fait un billet assez lourd mais je voulais absolument dire quelques mots de ETANOT dans sa version actuelle avant sa migration dans le nouveau référentiel producteur  du SIA/SIV d’ici quelques mois.



2 commentaires:

Aurélien Conraux a dit…

Bonjour,

Intéressant, mais on parle d'encodage en XML-EAC ou bien d'EAD ? Le schéma d'encodage XML issu d'ISAAR ne date que de 2011 (cf http://eac.staatsbibliothek-berlin.de/ )et comporte de reéelles avancées par rapport à la DTD EAD, notamment pour faire du linked data à partir de ces données d'autorité -ce qui, incidemment, justifiera certainement de faire ajouter automatiquement par un robot ce qui aujourd'hui est implicite...

Merci pour ton post en tout cas, j'ai un projet EAC sur le feu et c'est toujours utile d'avoir les adresses d'autres projets !

DA a dit…

Bonjour Aurélien.

On parle bien de l'EAC dans sa version beta d'août 2004. Cependant, comme tu le soulignes, cette DTD n’était pas pleinement satisfaisante et les archivistes français attendaient sa révision. C'est finalement la forme du schéma XML EAC-CPF qui s'est imposée et choisie comme schéma de métadonnées pour la description des producteurs dans le nouveau Système d’information archivistique (SIA) du site des Archives nationales (à Pierrefitte-sur-Seine).

Sa traduction française vient d'être réalisée par le groupe d'experts 4 de l'AFNOR et pour ce qui nous concerne, des tests de conversion de la DTD en XML EAC-CPF ont été effectués pour ETANOT avec des résultats très satisfaisants...

Attendons début 2013 pour voir les premiers résultats sur le site des AN.

Merci de ta contribution.