Article : Préserver les données numériques : de quoi parle t-on ?

         Si beaucoup de services patrimoniaux se posent aujourd’hui la question de la collecte des documents numériques, le sujet de la conservation à long terme des données versées est encore peu abordé et peu maîtrisé dans ses aspects concrets. Quel périmètre donner au mot « pérennisation »? Quels processus faire entrer en jeu ? Quelles compétences faire intervenir ?

 

         C’est pour tenter de répondre à ces questions que le SIAF, en partenariat avec l’équipe Vitam et les ministères de la Culture, de l'Europe et des Affaires étrangères et des Armées, a piloté au second semestre 2018 une étude intitulée « La pérennisation à long terme des informations numériques ». Elle a notamment abouti à une évaluation de la charge représentée par la mise en œuvre de la pérennisation dans les trois ministères, et propose trois scénarios : processus entièrement internes, en grande partie externalisés ou mutualisés.

         Ce travail, mené avec les cabinets Mintika et Serda, a souligné l’intérêt de la mutualisation entre services d’archives, notamment pour les processus complexes que sont la veille et l’expertise, afin que les plus grandes institutions puissent partager les résultats de leurs analyses et préconisations avec l’ensemble du réseau.

         L’étude apporte par ailleurs un éclairage synthétique et pédagogique du sujet et propose des scénarios de mise en œuvre de la fonction « pérennisation » par les professionnels.

Une partie des livrables, présentés ci-dessous et librement téléchargeables, est ainsi destinée à être largement réutilisable par tout service qui désire s’interroger sur la mise en œuvre de la pérennisation, quelles que soient sa taille et ses ressources.

 

Phase 1 : Qu'est-ce que la pérennisation ?

La première phase de l’étude a consisté à définir et documenter le sujet. Une analyse du périmètre du sujet  « Pérennisation » et une cartographie des concepts relatifs à la pérennisation (ci-dessous) permettent immédiatement de se rendre compte que les formats, qui sont généralement la première piste de réflexion associée à la conservation des données numériques, ne représentent qu’une petite partie des informations mobilisables sur le sujet (encadré rouge ci-dessous).

 

Les formats : une (petite) partie de l'ensemble des concepts liés à la pérennisation

 

Après réflexion entre les partenaires, il a finalement été décidé, comme le montre le schéma ci-dessous, de comprendre dans le périmètre étudié les aspects de versement et de communication des archives numériques.

 

 

Vous retrouverez en bas de page les liens pour télécharger ces deux documents au format PDF. Ils sont complétés par une bibliographie et une synthèse des principales normes et standards en vigueur dans le domaine (à l'exception des normes de formats, qui ne font pas l'objet d'un recensement exhaustif).

 

Phase 2 - Quelles actions pour mettre en œuvre la pérennisation ?

Cœur de l'étude, la phase 2 propose une modélisation des processus, sous-processus et actions à mettre en œuvre pour assurer la pérennisation des données versées dans un système d'archivage électronique. Elle offre un modèle théorique selon le standard BPMN1 qui peut être appliqué à toute entité désireuse de réfléchir à la pérennisation des données numériques qu'elle conserve.

 

Un exemple de modélisation : le processus "veille"

 

En complément de cette modélisation, les profils à mobiliser pour chacun des processus (archiviste, développeur, administrateur système...) ont été détaillés sous forme de schéma et de tableau, afin de faciliter dans un contexte donné le recensement des compétences indispensables à la mise en oeuvre d'une stratégie de pérennisation des données numériques.

Pour faciliter la sensibilisation des instances de décision, une vue simplifiée de la modélisation (ci-dessous) et une matrice des risques complètent les livrables. La matrice inclut des scénarios de risques et un degré de criticité pour chacun, tandis que l'impact et la probabilité d'occurrence sont laissés à l'appréciation de l'entité évaluée.

 

Vue simplifiée des processus modélisés

 

L'objectif de ces livrables est donc de proposer un socle solide de réflexion sur la pérennisation des données numériques quelles que soient les caractérisques du service concerné. En effet, la modélisation est indépendant de tout contexte et peut servir de référence pour identifier dans une structure quels processus sont ou non mis en oeuvre, quelles compétences sont mobilisables mais aussi à quels risques s'expose une structure en l'absence de stratégie de pérennisation, autant d'éléments qui peuvent constituer un argumentaire précieux auprès des instances de décision.

 

1. Business Process Model and Notation (BPMN) est un standard utilisé pour représenter d'une manière graphique les processus d'une organisation.

 

Livrables de la phase 1 :

Livrables de la phase 2 :

Liens