Affichage des articles dont le libellé est Axis. Afficher tous les articles
Affichage des articles dont le libellé est Axis. Afficher tous les articles

mardi 3 février 2015

Un éditeur XML gratuit


Voici un éditeur XML gratuit que j’affectionne personnellement pour les formations que je dispense. Simple et avec très peu de boutons à l’inverse d'oXygen extrêmement complet mais hélas propriétaire et dont l’accès est limité à 1 mois si on le télécharge.

Avec XML Copy Editor, l’éditeur dont je vous vante les mérites, il n’y a certes pas la possibilité de transformation, et c’est là le grand dommage, mais vous pouvez, et c’est un grand avantage, pouvoir changer la police pour la saisie d’XML.

Mais que fait au juste XML Copy Editor ?
Voici une page écran :



Il est bien adapté pour ceux qui découvrent le XML ou l’EAD (la DTD) ou l’EAC (le schéma) puisque XML Copy Editor peut lire toutes les DTD et tous les XSD ou RNG.

Mais qu’on ne s’y trompe pas, inutile de mettre des fichiers dans le dossier « templates » et de modifier le fichier « catalog » comme on fait habituellement pour faire comprendre et valider une DTD ou un schéma à un éditeur...ici ils ne fonctionnement pas.

Donc la solution que j’ai trouvé est de créer sous C:\XML Copy Editor un dossier EAD et un autre EAC dans lesquels je place respectivement toute la DTD-EAD et les fichiers de travail et tout le schéma avec ses fichiers de travail et là notre instance reconnaît les éléments et attributs divers.
Pour finir, autre bémol de XML Copy Editor, mais cela ne porte aucun préjudice à la saisie, ce sont les attributs qui n’apparaissent pas dans la boîte qui est censé les contenir (petite boîte tout en bas à droite...), alors je ferme tout simplement la boîte mais qu’on se rassure, les attributs sont toujours là et viennent automatiquement en tapant le signe = après l’élément en question.

Donc un 5 étoiles pour XML Copy Editor à télécharger sur sa Source Forge (il est en français).

mardi 25 juin 2013

SOSIE : élaborez votre IR en OpenOffice, on se charge de le transformer en XML/EAD…

Source de l’image : "Manuel de l’utilisateur Sosie", édition 2010

Comme je l’avais fait (voir les précédents billets) pour les applications ETAREP ou ETANOT telles qu’on pouvait encore les consulter jusqu’à la fin 2013 avant la «salle des inventaires virtuelle» (SIV) des Archives nationales (modification drastique de la précédente configuration, laquelle, pour la consultation d’ETAREP par exemple, nécessitait obligatoirement le navigateur Internet Explorer (version 5 et surtout pas les nouvelles !) et en ayant, au préalable, chargé le logiciel gratuit Adobe® SVG Viewer…), bref, une grosse lourdeur qui sera supprimée dans la SIV)…
Comme je l’avais fait pour les applications ETAREP ou ETANOT donc, j’essaie ici à l’instar de Cassandre, de prévoir l’avenir de SOSIE dans la nouvelle configuration SIV du SIA (le système d’information archivistique).

D’abord qu’est-ce que c’est ? SOSIE (pour Saisie en Open office pour la structuration d'Instruments de recherche en EAD) est un modèle OpenOffice de production d'instruments de recherche (IR) utilisé depuis près de trois ans aux Archives nationales mais aussi dans certaines Missions des Administrations centrales de l’État et depuis peu par toute collectivité territoriale (qui en fait la demande) souhaitant élaborer des instruments de recherche en XML/EAD….

Maintenant un peu d’histoire : en 2007, un groupe de travail auquel je faisais partie, avait été missionné par la direction des Archives nationales pour réfléchir à un modèle qui utiliserait les fonctionnalités du logiciel OpenOffice (open source comme chacun le sait) pour produire des instruments de recherche directement convertibles en XML/EAD grâce notamment aux feuilles styles. Il s’agissait en fait d’attribuer à chaque style de ce modèle, un élément de la DTD EAD et éventuellement de son attribut lorsqu’il existait et lorsqu’il était pertinent de le qualifier. La simplicité était telle que chaque élément (donc chaque style) qui correspondait à un niveau de description (comme préconisé par la norme ISAD(G)) était en français dans le texte.

Exemples :
unitid qui correspond à Référence dans ISAD(G) avait pour style Cote_consultation ou Identifiant.
unittitle ou Intitulé/Analyse de l’ISAD(G) avait pour style Intitule
…et ainsi de suite vous l’aurez compris…
origination devenait Nom du producteur dans SOSIE de même que physdesc devenait Desc_physique
…et le tout sous la forme d'une arborescence savante qui reprend l’ordre logique de rédaction d’un instrument de recherche. Je pouvais ainsi structurer mon IR en choisissant l’élément de la DTD EAD dans la liste (en français) proposée.

SOSIE convenait donc particulièrement pour la production d'un nouvel instrument de recherche, mais aussi pour une «rétroconversion» c’est-à-dire une reprise d'un fichier saisi sous un autre traitement de texte.
Source de l’image : "Manuel de l’utilisateur Sosie", édition 2010

Sur cette page d'écran de SOSIE, le «0_En_tete_EAD» correspond aux métadonnées de l’instrument de recherche, c’est en fait la «page de titre» dans laquelle on mettra les informations sur les conditions d'accès et d'utilisation des unités documentaires décrites, leur mode d'entrée, le producteur, l'historique de la conservation, les sources complémentaires, etc. Suivent ensuite le «Corps de l'instrument de recherche» proprement dit et l’«Index»…ce sont respectivement les parties «1_Description_archivistique» qui reprend les vingt-six éléments de l’ISAD(G) de la zone d'identification à la zone de notes et «2_Indexation» pour les noms de collectivités, les mots matières, les noms de personnes, les noms de lieux géographiques …partie «Index», que j’avais, en réalité, très peu utilisé jusqu’à présent.
Autre vue d'OpenOffice avec le modèle SOSIE et à gauche tous les styles (les éléments EAD)
Source de l’image : "Manuel de l’utilisateur Sosie", édition 2010
Voilà pour l’historique et les caractéristiques généraux et les diverses fonctionnalités de ce bel outil qui permettait de faire de l’EAD sans le savoir et en s’affranchissant de l’achat d’un éditeur (genre XMETAL, OXYGEN ou autre).
Ensuite, une fois l’instrument de recherche rédigé, c’est une opération batch qui permet alors de le convertir en un format XML/EAD en le déposant dans un répertoire «In» (rappelons que jusqu’à présent il s’agit encore d’un fichier avec l’extension .odt) et c’est après le passage du programme, de le récupérer en un .xml dans un répertoire «Out» (le batch classique quoi). On pouvait également utiliser une extension OpenOffice (un greffon) qui lançait le programme de conversion directement depuis OpenOffice pour obtenir au final un format «xml» à partir du fichier «odt».

Que va devenir SOSIE dans la nouvelle configuration SIV du SIA (le système d’information archivistique) et plus précisément dans le module «production des instruments de recherche» ? et d’abord pourquoi la conversion de .odt en .xml sur SOSIE ne fonctionne plus correctement?
J’oublie de dire que lors des dernières formations dispensées au Centre Phoenix pour les Études Libanaises à Beyrouth  vers la mi-mai de cette année, puis à l’Association des Archivistes français (AAF) le 22 mai dernier [stage EAD, parcours «EAD et EAC : des standards d’encodage pour les instruments de recherche»], en voulant montrer un exemple de conversion d’un fichier OpenOffice en un format XML/EAD, j’ai eu un grand moment de solitude : la conversion ne fonctionnait plus ! C’est seulement en ce début de mois que j’ai résolu le problème : SOSIE ne fonctionne que sur la version 3.0 d’OpenOffice (jusqu’à la version 3.2. mais plus sur LibreOffice, sa suite logique), ensuite attention aux mises à jour de JAVA : si vous avez autorisé votre ordinateur à mettre à jour automatiquement le JRE de JAVA vous devez en être à la version 7…or la conversion de SOSIE ne fonctionne que sur la version 6 de JAVA! Fallait le savoir.
Ainsi pour montrer à mes stagiaires un exemple de saisie sur SOSIE et sa conversion, j’ai été obligé de désinstaller le JRE7 et d’installer à nouveau la version le JRE6 (fort heureusement j’ai toujours l’ancienne version d’OpenOffice).

Exemple de saisie sous ICA-ATOM, ici la Zone d'identification de l'ISAD(G)
(on devrait avoir à peu près la même configuration sur le SIA,
module production d'instruments de recherche en remplacement de SOSIE)

Maintenant, quelle sera la place de SOSIE dans le nouveau système d’information archivistique (SIA)?…ce qui est sûr, c’est que tous les IR élaborés jusqu’à présent sous SOSIE seront intégralement et naturellement migrés dans le SIA, lequel prévoit de fournir un outil de production intégré à une plateforme de diffusion et d'interrogation. Ainsi nos futurs instruments de recherche (des Archives nationales uniquement, pas des Missions) seront à l’avenir, directement élaborés sur le SIA. Et l’ergonomie dans tout cela ? la saisie d’un nouvel IR se fera comme sous ICA-ATOM ou AVENIO ou ARKHÉÏA pour ne citer que ces outils, mais on nous promet que les puristes du «code xml» ne seront pas oubliés (un export de cette saisie "avec formulaire" sera possible et le fichier xml ainsi obtenu pourra être lu et modifié sous OXYGEN)…à suivre donc.

vendredi 26 octobre 2012

ETAREP et EAD

Image tirée du site des AN  sur un exemple de recherche en ETAREP 

ETAREP est une base du Minutier central des notaires de Paris, Archives nationales (AN) qui donne au lecteur l’ensemble des répertoires des notaires (environ 3000 répertoires de la fin du XVIe au début du XXe siècle) sous forme d’images numériques avec leurs notices descriptives rédigées en XML/EAD.

Après la présentation de ETANOT dans un précédent billet, voici maintenant la base ETAREP telle qu’on pouvait encore l’utiliser en 2012. En 2013 en effet, avec la mise en chantier de la salle des inventaires virtuelle (SIV) sur l'Internet et dans les salles de lecture des Archives nationales, la configuration sera totalement différente puisque depuis n'importe quel lieu, le lecteur disposera d'un espace de travail personnel dans lequel il pourra sauvegarder le résultat de ses recherches sur les cotes et éventuellement y cliquer directement (système de cote cliquable) pour commander son article ou sa liasse de telle étude de notaire…mais pas les répertoires de tel notaire puisque ceux ci ont été intégralement numérisés et consultables ainsi sur le site des AN.

Rappelons que les répertoires des notaires sont des registres établis par lui et où sont consignés chronologiquement tous les actes passés dans son étude. Ils sont très utiles au lecteur qu’il soit généalogiste, historien, chercheur, etc. pour localiser un acte précis dont il ne connaît qu’un intervalle de dates. D’une manière générale, les répertoires indiquent la date, la nature de l’acte (la typologie des actes fera l’objet d’un billet à venir) ainsi que les noms des parties. C’étaient en somme les premiers instruments de travail des clercs et notaires qui, aujourd’hui, nous servent d’instruments de recherche à part entière.

Une opportunité pour moi donc d’évoquer la genèse de ETAREP et son devenir.

Les répertoires forment une série presque complète (XVIe-XXe siècle) au Minutier central des notaires de Paris qui en conserve sur plus de 200 mètres linéaires de rayonnages (en fait presque toutes les études ont des répertoires), ce qui représente (source : site actuel des Archives nationales) environ 3300 répertoires correspondant à plus de deux millions de pages environ. Ces répertoires avaient déjà été microfilmés au cours des années précédentes.

En fait, cette opération ETAREP s’inscrivait dans un projet plus vaste appelé NOEMI qui avait pour but de procéder à la description directe en XML/EAD des dits répertoires et de leur mise directe sur Internet. Après une phase de réflexion et d’étude de faisabilité commencé en 2003, c’est l’année d’après (en 2004 donc) qu’un marché de numérisation de ces microfilms fut confié à la société SAFIG Numway (une partie avait été numérisée en 2001 par la société Jouve pour les études I à X). 

Ont également été numérisés, les répertoires des études déjà traitées au fur et à mesure de leur versement ainsi que les plus anciens qui eux, avaient été insérés dans des registres (c’est un peu compliqué à expliquer ici mais au tout début, les notaires se servaient des registres des minutes pour établir leur répertoires). Au fur et à mesure de cette numérisation, le contrôle (qualité des images, cohérence, etc.) a été assuré par le service informatique de cette époque ainsi que par le département de la conservation.

En ce qui concerne l’encodage, la description des répertoires s’est faite en deux étapes, d’abord par la rédaction classique de notices EAD décrivant chacune l’état des répertoires d’un notaire dans une étude et ensuite par l’établissement de liens entre les notices descriptives et les fichiers images numériques par l’élément dao (c’est un fichier type tableur Excel qui a permis le récolement et le contrôle des images stockées sur un serveur). Une instance EAD ayant un niveau level="item" avec pour attributs label="feuillets"> [ici l’indication des feuillets en recto et/ou verso], puis les classiques unitid, unittitle, unitdate, physdesc, genreform, etc.

Exemple :
RE/IX/1 Répertoire chronologique du notaire untel pour l'étude IX 10 novembre 1631-12 janvier 1635 untel notaire Ce répertoire contient  50 feuillets de papier manuscrits, et fait partie d'un registre de 110 feuillets, hauteur 30,5 x largeur 21 cm foliotés par le notaire. Le registre est dérelié, le premier feuillet est détaché., etc., obtenu par le code suivant (où j'enlève les chevrons, l'éditeur l'interprétant comme du vrai code !): 
did unitid RE/IX/1 /unitid unittitle Répertoire chronologique du notaire untel pour l' corpname normal="ET009" étude IX /corpname /unittitle unitdate type="inclusive" normal="1631-11-10/1635-01-12" 10 novembre 1631-12 janvier 1635 /unitdate origination persname normal="nom, prénom" untel notaire /persname /origination physdesc Ce répertoire contient   extent 50 feuillets /extent de papier manuscrits, et fait partie d' extent un registre /extent de extent 110 feuillets /extent , dimensions hauteur 30,5 x largeur 21 cm /dimensions foliotés par le notaire. Le registre est dérelié, le premier feuillet est détaché. /physdesc /did, etc.
La description du contenu scopecontent indique que le répertoire contient les informations suivantes: nature de l'acte, nom, prénom des parties, numéro de l'acte, etc.

Lorsque un registre contient aussi le répertoire des actes produits par un autre notaire (cas évoqué plus haut), alors on le renseigne aussi dans le scopecontent et on y indique le nom du notaire dans origination, persname normal="nom de l’autre notaire, prénom de l’autre notaire "prénom nom, persname, origination.

Exemple de recherche par nom du notaire : dans le menu déroulant, on sélectionne le nom du notaire.
(image tirée du document en ligne (en pdf) sur un exemple de recherche en ETAREP)



La saisie de ces notices descriptives s’est faite sur des postes équipés de la licence XMetaL et l’équipe de saisie comptait alors 9 personnes par équipes de 2 personnes à raison de trois séances d’une demie journée par semaine (personnels scientifiques, agents administratifs, agents techniques) épaulés de temps en temps par des vacataires.
Les personnels scientifiques, ainsi que les vacataires, avaient au préalable suivi le stage de formation théorique et pratique à l’utilisation de XML et de la DTD EAD organisé par le service informatique de l’époque. Les autres agents avaient été formés par les responsables du projet.
La mise sur Internet s’est faite en plusieurs étapes, d’abord la création de dossiers (un dossier par notice) regroupant pour chaque notaire la notice en XML/EAD, le fichier Excel de récolement et les images numériques correspondantes. Ensuite ces dossiers ont été transférés sur un serveur, organisés en autant de sous-dossiers selon la structure de l’instance XML/EAD, traités par Navimages (les notices étant alors publiées sur Pleade) et le travail final, remarquable par sa simplicité d’interrogation, sa rapidité de chargement des images et son agréable ergonomie, sans compter sa documentation complète, se découvre depuis 2011 sur le site des Archives nationales (rubrique  : Interroger la base de données ETAREP).

Pour chaque image, je peux en effectuer une rotation, l’afficher à sa taille réelle, l’agrandir en une entière ou une partie d’image (très simplement, en dessinant un rectangle pour sélectionner la partie à agrandir) et évidemment l’imprimer et auquel cas (et là je cite l’avertissement sur le site des AN) «Les contenus (images ou textes) mis à disposition sur ce site sont la propriété exclusive des Archives nationales. Seule la reproduction en vue d’un usage exclusivement privé des images et des textes contenus dans les différentes pages de ce site est autorisée. Toute diffusion de contenus sous quelque forme et sur quelque support que ce soit (papier, audiovisuel ou numérique), pour quelque finalité que ce soit (pédagogique, scientifique ou commerciale), doit faire l'objet d'une demande d'autorisation préalable auprès des Archives nationales».

Seul léger bémol, mais ce sera différent une fois effectuée la migration de cette base sur le SIV (voir plus haut), pour le moment, la consultation de ETAREP est optimisée sur le navigateur Internet Explorer en ayant chargé au préalable le logiciel gratuit Adobe® SVG Viewer…mais je peux tout aussi consulter ETAREP sur Chrome de Google (mais sur lequel j’aurai également chargé un émulateur Internet Explorer…un greffon gratuit qu’on trouve sur le site de Chrome).

Bref, comme je l’avais expliqué dans le billet sur ETANOT, j’ai voulu évoquer ETAREP dans sa version actuelle avant sa migration dans le nouveau système SIV d’ici quelques mois. Rendez-vous est donné en 2013.


mardi 16 octobre 2012

ETANOT et EAC

La base ETANOT sur le site des Archives nationales en 2012


ETANOT est une base des Archives nationales (AN) qui donne la liste des notaires parisiens depuis le XVe siècle environ jusqu’à nos jours, même si de nos jours, on le sait, le Minutier central ne conserve pas encore leurs archives.

Chaque notaire y a fait l’objet d’une notice (environ 3300 notices) qui donne son identité, ses dates d’exercice, l’étude dans laquelle il exerce ou il a exercé (aujourd’hui plus de 130 études mais seules 122 sont répertoriés), son adresse, sa localisation, des éléments de biographie si on les connaît (la sous-série BB/10 ministère de la Justice, Notaires, conservés aux Archives nationales, nous donne ces informations), et évidemment les archives qu’il a produites, etc.
Ces informations ressemblent beaucoup à celles trouvées dans les normes de description archivistique: ISAD(G) et ISAAR(CPF)…beaucoup plus dans cette dernière puisque l'objectif d'ISAAR(CPF) était la rédaction de notices d’autorité offrant une description détaillée des entités Collectivités, Personnes et/ou Familles permettant d'élaborer des notices dans lesquelles la forme du nom du producteur d'archives est normalisée pour constituer un point d'accès, et où sont données ses caractéristiques essentielles pour pouvoir replacer ses archives dans leur contexte de production, aujourd’hui et aussi dans le futur (en 2013 il est prévu que les notaires versent leurs minutes aux AN)…

Un petit mot sur la norme internationale sur les notices d'autorité ISAAR(CPF) publiée en 1996 par le Conseil international des archives (ICA) puis révisée en 2004 (on a constaté en effet que si la norme de description ISAD(G) permettait de décrire des notices d'autorité dans sa zone du contexte (zone 3.2), celles ci étaient tout de même assez sommaires)...

On prévoit d’ici 2013 de migrer la base ETANOT vers le nouveau système informatique (SIA/SIV) des AN, plus précisément dans le référentiel producteur. L’occasion pour moi donc, de revenir sur la genèse de cette innovante base imaginée et conçue dès 2004 par une géniale archiviste, alors responsable du service informatique des AN. Une vraie cyber-archiviste très visionnaire pour l’époque. Bravo à elle.

Dans les formations que je dispense, je donne souvent l’exemple de cette base pour illustrer ISAAR(CPF) et EAC, ce que je compte faire dans ce billet.

Mais d’abord, quelques aspects techniques de ETANOT : les notices proviennent d’une fort ancienne base de données documentaire alimentée et à tenue à jour régulièrement par le personnel du Minutier central depuis les années 1990. Cette base a été complétée par d’autres apports pour lesquels je ne rentre pas trop en détail, notamment l'outil informatisé d’orientation dans les fonds du Minutier central appelé Noemi pour NOtaire MInutes, lancé en 1995 mais qui n’a pu être mené à son terme, etc.

C’est cette base (type séquentielle indexée, et donc Cindoc pour ne pas la nommer, et donc pas du tout relationnelle) qui a été convertie d’un format texte structuré vers le format XML grâce à un programme XSLT sur mesure ! …seule une cyber-archiviste pouvait imaginer tel traitement…et c’était déjà en 2004.
Comme vous le savez, XSLT permet de restructurer les données, de les enrichir et de créer une instance XML complètement différente de celle d’origine. Ce qui s’est passé pour cette migration pour laquelle divers traitements ont structuré les données, des éléments d'indexation ont également été rajoutés pour enfin, aboutir à une instance XML conforme à la DTD Encoded Archival Context (EAC) version 2004, publiée et aujourd'hui consultable en ligne sur le site des AN et donc du ministère de la Culture.

ETANOT sera migrée dans le référentiel producteur du SIA (le nouveau système informatique des AN) en 2013. On pourra alors, depuis une notice d'autorité, pouvoir atteindre par simple clic un répertoire produit par le notaire ainsi qu’à toutes ses images numériques (rappelons qu’un répertoire est un registre établi par le notaire, où sont relevés dans l’ordre chronologique tous les actes passés dans une étude en indiquant essentiellement la date, la nature de l’acte et les noms des principales parties concernées, cette base existe, il s’agit de la base ETAREP, consultable sur le même site mais d’une manière indépendante pour le moment à cette adresse).

Bon, revenons maintenant à ce pour lequel j’ai rédigé ce billet : les équivalences des zones d'ISAAR(CPF) dans EAC en prenant pour exemple la base ETANOT.

Liste des notaires de l'étude XXIX
(mention obligatoire : notice extraite de l'application ETANOT, pour toute diffusion publique ou exploitation commerciale, une autorisation préalable est à demander aux Archives nationales)

S’il n'existe pas de correspondance stricte (élément à élément) entre ISAAR(CPF) et l’EAC, on peut toutefois faire correspondre certains éléments de la norme à des éléments spécifiques de la DTD (où on y trouve l'intégralité des éléments d'ISAAR(CPF)).

Déjà, voyons l’élément racine obligatoire qui signale une nouvelle instance, elle se subdivise en deux éléments qui ne correspondent en rien aux deux sections 5 et 6 (5 Éléments d'une notice d'autorité et 6 Relations entre les collectivités, les personnes et les familles, et des ressources archivistiques ou autres). Ces deux éléments correspondent en fait à la Zone du contrôle 5.4 et, ici "description du notaire", qui regroupe les informations de 5.1 à 5.3...bon, c'est un peu alambiqué comme système mais on s'y retrouve ensuite lorsque l'instance est publiée et mise en ligne.

Ensuite seuls 4 éléments sont obligatoires dans ISAAR (CPF) [Type d’entité, Nom, Date, Numéro] et tous figurent dans ETANOT, sauf le premier, implicite, qui est 5.1.1. Type d’entité = P (personne). Les 3 autres sont 5.1.2 Forme autorisée du nom = ici Nom du notaire, 5.2.1 Date d’existence du producteur = ici Dates d’exercice et 5.4.1 Code d’identification notice = Numéro de notice (exemple FRDAFANCH00MC_NANOTAIRE03027).



Nom du notaire=5.1.2 Forme autorisée du nom
Dates d’exercice=5.2.1 Date d’existence du producteur
 Numéro de notice=5.4.1 Code d’identification notice
etc.
(mention obligatoire : notice extraite de l'application ETANOT, pour toute diffusion publique ou exploitation commerciale, une autorisation préalable est à demander aux Archives nationales)


Voyons à présent la reprise zone par zone en commençant par la Zone d’identification. On trouve 5.1.5 Autres formes du nom = Autre(s) forme(s) du nom (Formes parallèles du nom (5.1.3) n’a pas été utilisé de même que  Formes du nom normalisées selon d’autres conventions (5.1.4) ainsi que, et ça se comprend, le Numéro d’immatriculation des collectivités (5.1.6).

5.2.2 Histoire = ici Informations biographiques qui se retrouve autant que faire se peut, dans un grand nombre de notices (informations glanés ça et là dans les almanachs, bulletins officiels, tables des lois, etc. et notamment en BB/10).

5.2.3 Lieux = ici Adresse(s) professionnelle(s), se retrouve partout (exemple : rue de la Ferronnerie de 1776 à 1782, rue Croix-des-Petits-Champs de 1783 à l’an II) et une particularité est que «Paris» est implicite sauf mention contraire.

5.2.4 Statut juridique n’a pas été retenu dans ETANOT (aujourd’hui cela pourra poser un problème car comment donner l’information sur un notaire dépendant hiérarchiquement d'un autre «producteur» doté d’une personnalité morale, quel statut juridique pourra être retenu pour une «Société de notaires» par exemple ?)…j’ose imaginer et espérer, mais je n’ai aucune vision future de la V2 du SIA/SIV, que celle ci nous donnera la possibilité de le renseigner et de l’encoder.

5.2.5 Fonctions et activités non plus n’a pas été retenu dans ETANOT parce que implicite (il faudrait en effet mettre partout «Notaire»…).

5.2.6 Textes de référence : on aurait pu y mettre les informations des lettres de provision d’office, des décrets, des arrêtés de nomination, etc. mais en réalité on les retrouve dans 5.2.2 Histoire vu plus haut.

5.2.7 Organisation interne/généalogie, non retenu car il s’agit évidemment de Collectivités/Familles.

5.2.8 Contexte général : figure en introduction sur la page d’accueil du site, donc inutile de le répéter systématiquement.

Poursuivons notre reprise zone par zone et intéressons-nous au Type de relation qui, rappelons-le peut être chronologique, hiérarchique, d’association, d’appartenance (à une famille). Dans ETANOT, le type de relation est implicite sur le plan de la relation chronologique (on sait que tel notaire a eu pour prédécesseur untel et successeur un autre grâce aux noms qui s’affichent chronologiquement sous le numéro de l’étude concernée).

Pour ce qui concerne 5.4.2. Code d’identification du ou des services qui ont élaboré la notice d’autorité , le terme générique «Minutier central» est implicite.

5.4.3. Règles ou conventions suivies est indiqué sur la page introductive.

5.4.4. Niveau d’élaboration (projet, notice validée, révisée, détruite) : «notice validée» est implicite dans ETANOT…on aurait pu prévoir d’autres choix (la V2 du SIA/SIV donnera-t-elle la possibilité de l’encoder ?).

Enfin la Zone du contrôle.
5.4.5. Niveau de détail (élémentaire, moyen ou complet) : cette information manque également dans ETANOT mais comme la norme ISAAR (CPF) prévoit qu’une notice peut être élémentaire, moyenne ou complète, les niveaux «élémentaire» et «complet» étant définis par la norme, le niveau «moyen» est laissé à l'appréciation des utilisateurs, on peut supposer que le niveau est «complet» puisqu’à l’exception de Statut juridique, un bon nombre de champs est renseigné comme les Histoire, Lieux, Fonctions et activités, Textes de référence et Sources, etc.

5.4.6. Date(s) de création, de révision ou de destruction : manque dans ETANOT.

5.4.8. Sources : ces informations figurent dans «Autres documents connus relatifs au notaire» et dans «Éléments de bibliographie», mais il y a déjà beaucoup d’informations à ce sujet dans les pages d’introduction sur le site.

5.4.9. Notes relatives à la mise à jour de la notice : le nom de l’auteur de la notice ne figure pas dans ETANOT mais seulement dans la base de données à plat dont j’ai dit quelques mots plus haut.
Bon voilà tout. Ça fait un billet assez lourd mais je voulais absolument dire quelques mots de ETANOT dans sa version actuelle avant sa migration dans le nouveau référentiel producteur  du SIA/SIV d’ici quelques mois.



mercredi 13 juin 2012

EAD et EAC : des standards d’encodage pour les instruments de recherche



Au moment où j’écris ces lignes, les participants du stage «EAD et EAC : des standards d’encodage pour les instruments de recherche» organisé par le centre de formation de l’Association des archivistes français (AAF) sont certainement en train de publier leurs instruments de recherche encodés ce matin en EAC.

Ce stage a commencé lundi 11 et se termine aujourd’hui 13 juin. J’y étais, mais cette fois ci, de l’autre côté de la table. J’étais formateur.
Les stages organisés par l’AAF sont en général très complets (voyez leur brochure en pdf). Ici on avait demandé aux participants d’avoir un pré- requis sur la connaissance des normes ISAD(G) et ISAAR(CPF), une légère expérience en matière de description archivistique et d’élaboration d’instruments de recherche. Seule une participante ne «pratiquait» pas l’ISAD(G)… selon elle. En réalité elle avait de bonnes pratiques archivistiques et pouvait par conséquent suivre notre cours pour acquérir des connaissances de base théoriques et pratiques sur la description archivistique encodée (EAD) [lundi et mardi par nous] et l’encodage de la description des producteurs d’archives (EAC) [aujourd’hui mercredi par une autre collègue].



Nous avons commencé par rappeler l’histoire et les origines de l’EAD qui évolue dans un environnement normalisé. Nous avons poursuivi par le substrat technique en initiant très rapidement les stagiaires à l’XML (Extensible Markup Language) et les DTD (Document Type Definition).
La structure de l’EAD et la correspondance avec la norme ISAD(G) a ensuite fait l’objet d’un petit exercice pratique.
Enfin, nous avons donné un aperçu des outils de production et de publication d’instruments de recherche en XML/EAD ainsi que les présentations des réalisations récentes en France.
L’après-midi de lundi avait été consacré aux exercices pratiques d’encodage de leurs propres instruments de recherche sur XMetaL. Et si les participants ne les avaient pas ramenés alors nous avions tout de même des dizaines d’exemples en stock!

Bref je suis content des conditions de la salle de stage de l’AAF (dotée tout récemment d’ordinateurs portables…un ordinateur par stagiaire !) et des stagiaires en général. Ils ont été très attentifs, posant de bonnes questions et on sentait une adéquation étroite entre leurs besoins et leurs attentes avec l’objectif du stage (c’est pas toujours le cas). Je vous conseille vivement les stages de l’AAF qui conviennent réellement aux besoins des archivistes dans leur diversité (un peu comme les stages du SIAF aussi).

vendredi 11 mai 2012

Traduction française de la Tag Library de l'EAC-CPF



La voilà enfin cette publication tant attendue de la traduction française de la bibliothèque de balises ("Tag Library") de l'EAC-CPF réalisée par le groupe d'experts AFNOR CG46/CN357/GE4 "Données d'autorité". Elle est en format PDF sur le site des Archives de France http://www.archivesdefrance.culture.gouv.fr/gerer/classement/normes-outils/eac/

Je reprends ici, et en partie, le message de Claire Sibille-de Grimoüard (Ministère de la Culture, Direction générale des Patrimoines, SIAF, Sous-direction de la politique interministérielle et territoriale pour les archives traditionnelles et numériques) qui précise que cette traduction est le résultat de plus d'un an de travail collaboratif des archivistes et des bibliothécaires membres du dit groupe d'experts AFNOR.

L'objectif de cette publication est de fournir aux utilisateurs francophones la documentation nécessaire pour la mise en œuvre de l'EAC-CPF et pour son utilisation dans les formations, pour ainsi contribuer à promouvoir la diffusion du standard.

Pour l’instant les exemples sont ceux de la version anglaise originale mais des exemples français commentés d'instances EAC-CPF complètes sont fournis en plus de la traduction, sous forme de fichiers XML téléchargeables.

Comme vous le savez, des travaux sont en cours pour la révision de l'EAD dans le contexte actuel du web sémantique (voir notamment le compte rendu de Claire Sibille-de Grimoüard du 75e congrès annuel de la Société des archivistes américains à Chicago, les 22-27 août 2011, sur
http://www.archivesdefrance.culture.gouv.fr/static/5236 ). Aussi cette documentation de l'EAC-CPF est, à l’avenir, susceptible de prévoir ces évolutions. Le groupe d'experts AFNOR s'est donc engagé à participer à ce processus et veillera à la mise à jour de la traduction française de la bibliothèque de balises de l'EAC-CPF.

mercredi 17 janvier 2007

-Xmx512m, fin

A bout de force et de patience, nous avons fini par lever le lièvre du -Xmx512m soi-disant non déclaré lors de l’installation Pleade2 sur certains postes (voir notre billet précédent). C’est une collègue qui, ayant consacré son dimanche après-midi, nous livre la solution...
En réalité, l'adresse de la machine Java n’est pas indiquée dans les nouveaux scripts (pour ceux qui ont Pleade1, cela ne pose pas de problème puisque tout a déjà été configuré), en revanche pour Pleade2, lorsque survient le problème ‘windows ne trouve pas -Xmx512m’ alors que la totalité du ‘package’ a été installé, voici ce qu’il convient de faire:
  • Désinstaller (par panneau de configuration/suppression de programmes) toutes les versions de Java présentes ainsi que Pleade2 et supprimer le répertoire PLEADE.
  • Redémarrer.
  • Retélécharger Pleade2, l'installateur va nous proposer d'installer Java et on accepte (puisque on l'a supprimé...), on installe ensuite tout le ‘package’ normalement.
  • Mais avant de démarrer Pleade, il faut manuellement déclarer la variable d'environnement de Java pour que Windows le trouve : panneau de configuration/système/avancé/variables d'environnement/nouveau : le nom de la variable est JRE_HOME (attention ! à taper en majuscules), la valeur est C:\Program Files\Java\jre1.5.0_07. on valide et voilà : Pleade démarre sans problème !!!!
Bonnes publications et merci encore à toute l'équipe de Pleade (http://pleade.org) pour cette excellente plateforme.

samedi 6 janvier 2007

-Xmx512

« Ayez, si vous pouvez, un langage simple, et tel que l'ont ceux en qui vous ne trouvez aucun esprit : peut-être alors croira-t-on que vous en avez ».
Jean de la Bruyère.

Il y a quelque temps je me suis amusé à télécharger Pleade 2.0PR1 disponible depuis septembre 2006 (Pleade est un outil libre conçu spécifiquement pour la publication d'instruments de recherche sous la forme de documents EAD... l'EAD étant un format XML pour structurer des instruments de recherche, format compatible avec l'ISAD(G) et utilisé dans de nombreux pays, etc, pour en savoir plus, voyez les sites appropriés à l’EAD, l’ISAD(G) ou à Pleade sur www.pleade.org). Cet outil de publication permet de diffuser des instruments de recherche archivistiques avec un puissant moteur de recherche ainsi que de nombreuses possibilités d'adaptation. J’en suis fort content d’autant que je reconfigure l’habillage et modifie Pleade (c’est permis puisque c’est outil libre !) pour obtenir une interface personnalisée, en particulier en ce qui concerne la présentation de l'information, le graphisme, etc.
J’ai également installé pour deux de mes collègues ce puissant outil de publication mais sur le poste d’une troisième collègue, au démarrage de Pleade (une fois l’installation terminée donc), nous obtenons cette erreur « -Xmx512 pas adapté ou quelque chose de ce genre », et rien n’y fait, impossible de démarrer l’application…on se renseigne sur la toile, et il paraîtrait que ce problème est inhérent à ceux qui utilisent « tomcat 5.0.19 sur un serveur dédié qui tourne sous readhat 7.2 ! et que si dans le manager (ou on peut voir l'évolution de la mémoire de la JVM la mémoire est plafonnée a 63.56 Mo alors celle-ci est à 512Mo de mémoire, alors pour passer à 1 Go on nous propose d’ajouter dans le fichier catalina.sh ce petit code :
.
paramètres -Xmx512
#!/bin/sh
# -----------------------------------------------------------------------------
# Start Script for the my own CATALINA Server
# -----------------------------------------------------------------------------

exec startup.sh -Xmx512

Monsieur de la Bruyère, au secours…