Quelles perspectives pour des politiques de numérisation patrimoniale écoresponsables ?

La Commission Bibliothèques vertes de l’Association des Bibliothécaires de France (ABF) vous propose aujourd’hui un billet qui traite de numérisation de collections et d’écoresponsabilité, en donnant la parole à Thomas Creusot, actuellement élève conservateur à l’Enssib, dont le sujet de mémoire d’étude pour ce diplôme d’état explore et documente ce sujet.

Thomas Creusot apporte ici un regard sur la question de l’impact environnemental des politiques de numérisation patrimoniale et sur les enjeux d’écoresponsabilité entourant ce service numérique d’importance dans de nombreuses bibliothèques, en présentant les points saillants & conclusions de son étude.

Prendre conscience de l’impact environnemental

« La prise de conscience de l’impact environnemental du numérique est chose récente, née peu ou prou avec le millénaire. Marqué par le développement de l’Internet grand public, du smartphone et des réseaux sociaux et par l’entrée soudaine dans l’ère du big data et de l’économie des données personnelles, le début des années 2000 apparaît ainsi comme un moment charnière. L’enthousiasme technologique des débuts de la cybernétique se heurte soudain aux limites physiques de l’univers numérique : eh oui, le numérique, c’est du concret ! Le journaliste Guillaume Pitron peut même affirmer que « les technologies « dématérialisées » […] sont en voie de constituer l’une des plus vastes entreprises de matérialisation jamais engagées »[1]. La dématérialisation d’une part grandissante de nos activités s’est ainsi accompagnée du développement d’une infrastructure matérielle qui, pour être souvent invisibilisée, n’en est pas moins émettrice d’externalités négatives, au premier rang desquelles doit être comptée l’empreinte environnementale.

Épuisement des ressources abiotiques (dont les fameuses « terres rares »), acidification des sols, radiations ionisantes, alimentation électrique des appareils et surtout des serveurs, qui hébergent un nombre toujours croissant de données (leur somme totale est passée, entre 2010 et 2020, de 2 zettaoctets (Zo) – soit 2 000 milliards de gigaoctets –, à 64 Zo[2]) : l’addition est lourde. Dans ce contexte, s’intéresser aux données produites par les politiques de numérisation patrimoniale relèverait presque de l’anecdote. À l’aune de cette trajectoire effrénée, amplifiée encore par la généralisation des objets connectés et le déploiement de l’intelligence artificielle, non seulement la quantité des données mises en ligne par les établissements patrimoniaux est infime, mais les usages qui en sont faits apparaissent bien peu gourmands. »

« Plus encore, la numérisation patrimoniale, devenue une pratique courante portée par d’ambitieuses politiques publiques, fonde sa légitimité sur la recherche de l’intérêt général. Ses trois missions principales poursuivent ainsi les objectifs collectivement reconnus aux bibliothèques : préservation et conservation des collections, diffusion et valorisation du patrimoine, amélioration des services rendus aux usagers. Si les premiers projets de bibliothèques numériques ne visaient pas l’exhaustivité, il semble bien que, depuis une vingtaine d’années, sous l’effet de la massification des politiques de numérisation patrimoniale, « l’horizon d’une mise en ligne de tous les livres imprimés [est apparu] comme de moins en moins lointain et inaccessible »[3].

Le ton d’un article[4] signé en 2019, dans la revue The American Archivist, par une équipe d’archivistes américains, contraste singulièrement avec cet enthousiasme. Pionnier sur la question de l’impact environnemental de la préservation des données numériques culturelles, ce papier appelait à un changement de paradigme. Après avoir constaté qu’un « tel changement a été proposé dans des contextes de gestion de documents d’archives [records management] ou de big data », il faisait remarquer que « le secteur du patrimoine culturel dans son ensemble ferait bien de travailler dans le sens d’une révision semblable ». La trajectoire esquissée par des plans de numérisation de masse, menés de manière cloisonnée par les établissements, en haute qualité, dans des formats lourds et dupliqués, ne serait plus soutenable.

Aborder la question sous l’angle des communs permet peut-être de mieux prendre la mesure du problème, qui s’apparente à un véritable nœud gordien. Alors que la numérisation patrimoniale permet de rendre effective, à un degré encore inédit, la nature de « bien commun » du patrimoine conservé dans les bibliothèques, en l’envisageant réellement comme une ressource collective et partagée, comment faire place aux conséquences délétères de ces politiques, précisément sur d’autres biens communs : les ressources en métaux rares, en eau, les équilibres environnementaux et climatiques ?

Tout commence par les équipements, qui concentrent l’essentiel des impacts environnementaux du secteur du numérique[5] : numériseurs et appareils photos, sans parler du matériel bureautique nécessaire au traitement des données numérisées. L’impact des équipements se concentre très largement sur la phase de production : elle représente ainsi 80 % de leur empreinte carbone. Des outils tels que la méthodologie ACV (Analyse du cycle de vie), qui permettent de dépasser la stricte empreinte carbone, révèlent un impact encore plus considérable : la production de composants nécessite une grande quantité d’énergie et de matériaux rares dont l’extraction est complexe et génératrice de multiples impacts. Il convient donc d’appliquer aux numériseurs, comme à d’autres appareils électroniques, la règle bien connue des « 4 R » : réparer, réutiliser, recycler, réduire, en veillant à accroître la durée de vie d’appareils à fort impact, et globalement sous-employés. La Bibliothèque municipale de Dijon et le Pôle documentation de l’Université de Bourgogne ont ainsi contractualisé en vue d’une utilisation partagée d’un numériseur patrimonial, ce qui permet d’amortir son coût environnemental. »

« Autre point critique : les solutions d’hébergement et d’archivage des données. Le levier d’action, ici, est double. Il s’agit d’abord de réduire le volume des données produites et stockées. Cet impératif, rappelé notamment par le guide Bonnes pratiques Numérique responsable dans les organisations, élaboré par la MiNumÉco[6], se heurte toutefois, dans le cas particulier de la numérisation patrimoniale, à l’enjeu de la qualité suffisante des substituts numériques proposés. On ne peut faire l’économie, ici, d’un calcul bénéfices-risques : à mesure que diminuent le poids du fichier, sous l’effet d’algorithmes de compression, et la qualité de la résolution, les risques de pertes de données et de nécessité de numériser à nouveau augmentent. C’est pourquoi une approche responsable de la numérisation privilégiera le choix d’un format tel que le JPEG 2000 : économe et durable, recommandé notamment par la BnF, il offre à la fois une compression d’excellente qualité (supérieure au JPEG) et des gains d’espace disque très intéressants (meilleurs que le JPEG). Il remplit ainsi les conditions pour servir à la fois de fichier de diffusion et d’archivage, tout en étant considérablement moins lourd que le TIFF.

Si le choix de la résolution doit s’adapter aux usages attendus du fichier image, on rappellera qu’une résolution de 300 dpi est amplement suffisante pour garantir une bonne qualité d’affichage de l’image, qui contient suffisamment d’informations pour que le produit numérisé soit estimé conforme à l’original[7]. Le passage de 300 à 400 dpi, alors qu’il ne représente qu’une hausse de 33 % de la résolution, correspond à une augmentation de 78 % du poids de l’image. En faisant passer la résolution de 300 à 600 dpi, on quadruple le poids du fichier – et en accompagnant ce doublement de la résolution par le choix de la couleur plutôt que des niveaux de gris, on multiplie le poids de l’image par 12 ! »

« L’impact de la donnée ne se limite pas aux conditions de sa production : les caractéristiques propres au mode d’encodage et d’enregistrement de la donnée physique ou analogique déterminent certes le poids de la donnée numérique produite, mais une approche sobre sera également attentive aux solutions de stockage et d’archivage.

Grâce à la mise en œuvre de technologies d’optimisation énergétique (optimisation des régimes de températures d’eau, gestion des flux d’air, free chilling ou free cooling), et des logiques accrues de mutualisation de serveurs, les datacentres de nouvelle génération sont nettement plus sobres : le chantier actuellement porté, sur le campus de la Doua, par l’Université Lyon1 et l’INSA-Lyon, en est un excellent exemple. Dans le paysage bibliothéconomique, cette logique de concentration des serveurs a notamment été mise en œuvre par la Bibliothèque royale des Pays-Bas. Les serveurs abritant les données de sa plate-forme de presse ancienne numérisée (baptisée « Delpher »), situés auparavant dans les locaux de la Bibliothèque royale, ont été déplacés vers un datacentre gouvernemental[8], partagé et plus efficace, grâce à des technologies d’optimisation énergétique qui permettent d’éviter la consommation annuelle de 196 000 kWh – c’est-à-dire 109 tonnes de CO2, soit l’équivalent de la consommation énergétique annuelle de 79 foyers néerlandais[9]. Le recours massif à des sources d’énergie renouvelable permet en outre à la Bibliothèque royale de maîtriser l’empreinte carbone des serveurs de « Delpher », qui s’élève à 4 tonnes de CO2, pour plus de deux millions de documents accessibles en ligne.

L’enjeu de l’archivage pérenne est un bon exemple de la tension soulevée par une gestion durable du numérique. Envisager la durabilité des collections numérisées nécessite de recourir à des formes d’archivage pérenne, tel que le proposent aujourd’hui le Cines (Centre informatique national de l’enseignement supérieur) ou la BnF. Pourtant, ces technologies sont très énergivores : aussi est-il impératif de soigner leur efficacité énergétique, en procédant avec davantage de parcimonie aux contrôles d’intégrité, en les planifiant hors des pics de consommation, en optant pour des modes de stockage « à froid », quitte à réinterroger le principe d’accès immédiat du patrimoine numérisé. Il paraît également difficile de faire l’économie d’une gestion plus fine de ce patrimoine numérique, en mettant en œuvre une approche graduée de l’archivage pérenne, par un plan de gestion des données patrimoniales numérisées qui définirait, pour chacune d’elles, le degré de préservation attendu, en fonction de critères laissés à l’appréciation des bibliothécaires, dont l’expertise sur leurs fonds redevient ainsi déterminante. »

« On ne le dira jamais assez : une donnée sobre est une donnée bien signalée et interopérable. En ce sens, la technologie IIIF (International Image Interoperability Framework) est vertueuse, en permettant à des bibliothèques numériques d’afficher des données appelées depuis un serveur IIIF, sans en assumer le stockage. Une telle infrastructure d’hébergement permet ainsi de dédoublonner le stockage des fichiers, ce qui réduit le coût de maintenance de la donnée. La bibliothèque numérique de la Bibliothèque Sainte-Geneviève, baptisée Genovefa, née en collaboration avec l’Institut de recherche et d’histoire des textes (IRHT) en offre un excellent exemple.

Plus largement, le Référentiel d’écoconception des services numériques (RGESN) est une boussole pour la création ou la refonte de portails web responsables. Parmi les nombreux outils d’évaluation de la performance environnementale des sites web, l’EcoIndex de Frédéric Bordage mérite de retenir l’intérêt. D’usage libre et gratuit, il fournit le « score environnemental d’une page web », prenant en compte trois critères techniques : le poids de la page, sa complexité et son nombre de requêtes HTTP (qui permet de mesurer l’effort fourni par les serveurs pour afficher la page : plus le nombre est élevé, plus il faudra de serveurs pour servir la page). L’ÉcoIndex présente également l’intérêt d’accompagner son diagnostic de quelques pistes d’amélioration, suivant les critères qui se sont révélés les plus critiques : optimisation du format des images, compression des fichiers, limitation du contenu et des fonctionnalités à l’essentiel, limitation des « carrousels » et défilements infinis, limitation de l’utilisation de widgets et de plugins, utilisation de polices standards, etc. Consciente de l’enjeu, l’agence Occitanie Livre & Lecture, qui prépare le lancement d’un site web de valorisation du patrimoine écrit, graphique et sonore conservé en région Occitanie, a ainsi inclus une clause d’éco-conception dans son cahier des charges, en renvoyant à la liste des bonnes pratiques proposée par l’ADEME, à celle fournie par le collectif GreenIT et au RGESN. »

« De manière apparemment triviale, l’article de The American Archivist rappelle que la première question que doit se poser une institution patrimoniale sur le point de numériser est celle-ci : « a-t-on démontré l’existence d’un besoin de mise à disposition numérique d’un document analogique ? ». La deuxième question est celle de l’adéquation de la solution technique retenue avec l’usage attendu de la ressource. Une numérisation à 400 dpi est-elle vraiment nécessaire, s’il s’agit de presse ancienne ou d’un ouvrage imprimé ? Une démarche sobre recherchera en effet, plutôt que la meilleure qualité possible, le « suffisamment bon » niveau, c’est-à-dire celui qui optimise le rapport entre la quantité d’énergie mobilisée pour créer, maintenir et mettre à disposition la donnée numérique et la réalité de l’usage qui en est fait. La variété des contextes n’autorise que des appréciations adaptées à chaque cas de figure.  Dans le cas de numérisations conservatives de documents fragiles, qu’une re-numérisation mettrait en péril, il convient naturellement de sécuriser au maximum la donnée ainsi produite : la durabilité s’entend ici par la recherche d’une qualité suffisante pour éviter d’endommager, voire de détruire le document en cas de seconde numérisation. Pour de la numérisation courante, réalisée sur la demande d’un chercheur, ne vaudrait-il mieux pas privilégier une solution modeste : un fichier de basse qualité, que l’on ne conservera pas sur les serveurs de l’établissement ?

Au fond, la prise en compte de l’impact environnemental dans la définition de politiques de numérisation patrimoniale invite à déboulonner trois fétiches, qui apparaissent comme autant de mythes tenaces : l’accessibilité immédiate de la donnée numérisée ; la perfection de la conservation pérenne ; le numérique comme avenir et miroir de l’original physique. Seul ce « désenchantement » des attentes que l’on porte au recours au numérique, entreprise nécessaire au vu de la trajectoire insoutenable de la digitalisation de nos activités humaines, permettrait de justifier des politiques de « numérisation suffisante ». Car ce qui se pose, in fine, c’est bien la question de la justification du recours à l’artefact numérique : « La numérisation a lieu en réponse à des besoins qui ont été démontrés, qui peuvent être justifiés sur la base de la législation, de la dégradation naturelle des biens patrimoniaux, de demandes d’usagers, et d’utilisabilité interne », rappellent les autrices d’un article éclairant sur la question[10]. Ainsi, Rodolphe Leroy, de l’Université de Bourgogne, témoigne explicitement d’une volonté de « restriction de la production de données pour correspondre prioritairement au périmètre local », qui englobe l’activité d’enseignement et de recherche des enseignants chercheurs de l’université, les projets possibles de médiation, les sollicitations d’acteurs locaux, etc. Autrement dit, une numérisation durable, responsable, serait donc avant tout celle qui ne vise pas à constituer le stock de données numériques le plus large, mais celle qui veille à inscrire les données ainsi produites dans un écosystème qui saura leur conférer une plus-value et, ce faisant, amortir le coût, économique comme environnemental, de leur production.

Dès lors, pourquoi ne pas inclure davantage les usagers dans la définition et la mise en œuvre des politiques de numérisation patrimoniale ? Parce que responsabilité environnementale et sociale doivent être pensées de pair, l’inclusion du public dans la formalisation d’une politique de numérisation participe d’un usage responsable de la ressource numérique. Elle est le meilleur moyen d’empêcher que les bibliothèques numériques ne deviennent des poids morts dans l’écosystème du Web : des objets digitaux peu consultés, qui n’amortiront jamais leurs coûts de production et de maintenance. En outre, l’écoconception peut devenir une externalité positive de la prise en compte du parcours utilisateur dans la création d’un portail patrimonial. C’est le cas de la bibliothèque numérique de la communauté d’agglomération Valence Romans Agglo, « L’Empreinte », conçue grâce à des démarches de design UX. Or celle-ci a obtenu un excellent score à l’EcoIndex, alors même que l’écoconception ne figurait pas dans son cahier des charges. La logique « centrée utilisateur », qui met en avant des fonctionnalités réellement attendues par le grand public, a abouti à un niveau élevé d’ergonomie, à un parcours d’utilisation optimisé, à une navigation plus fluide. Or, en facilitant la navigation, on réduit les flux de données, et on favorise un usage plus sobre du Web. »

« La nature de la responsabilité d’une politique de numérisation patrimoniale est ainsi fonction du contexte, de l’environnement informatique et institutionnel de l’établissement, de l’état de conservation des documents, de la nature du besoin identifié et de l’usage qui en sera fait. C’est en fonction de ces paramètres qu’il convient de moduler la qualité d’acquisition, les modalités de stockage, de pérennisation et de mise à disposition des données. On l’aura compris : de même qu’il n’existe pas un projet de numérisation similaire à un autre, il n’existe pas une seule solution de numérisation responsable. »


[1] Pitron Guillaume, « Quand le numérique détruit la planète », Le Monde diplomatique, octobre 2021, p. 18-19.

[2] Stricot Matthieu, « Penser des datacenters moins énergivores », CNRS Le journal, 14 septembre 2023 (https://lejournal.cnrs.fr/articles/penser-des-datacenters-moins-energivores).

[3] Grunberg Gérald, « Les trois dimensions des bibliothèques numériques », dans : Dufrêne Bernadette, Ihadjadene Madjid et Bruckmann Denis (dir.), Numérisation du patrimoine. Quelles médiations ? Quels accès ? Quelles cultures ?, Paris : Hermann, 2013, p. 161.

[4] Pendergrass Keith L., Alagna Laura, Sampson W. et Walsh Tim, « Toward Environnementally Sustainable Digital Preservation », The American Archivist, vol. 82, n° 1, 2019 (Toward Environmentally Sustainable Digital Preservation | The American Archivist (allenpress.com).

[5] Arcep et Ademe, Évaluation de l’impact environnemental du numérique en France et analyse prospective. Note de synthèse, 19 janvier 2022.

[6] Mission Numérique Écoresponsable, Guide Bonnes pratiques numérique responsable pour les organisations, version 1, mai 2023, p. 64.

[7] Maillet Dominique, La reproduction de sauvegarde des documents patrimoniaux. Partie 1. Numérisation et conservation, Bibliothèque nationale de France, p. 4.

[8] Gillisse Robert, Groen Arie, Van Zwol Tamara et Wijsman Lotte, « The CO2 Emissions of Storage and Use of Digital Objects and Data. Explorate climate actions », iPres 2022 : The 18th International Conference on Digital Preservation, Glasgow, Scotland.

[9] Id., The CO2 Emissions Of Storage And Use Of Digital Objects And Data. Case Study Platform Delpher (https://osf.io/8qjzh)

[10] Fafet Charlotte, Milios Leonidas et Paschalidou Evangelia, « A Strong Sustainibility Framework for Digital Preservation of Cultural Heritage: Introducing the Eco-Sufficiency Perspective », Heritage, 2022/5, p. 1066-1088.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *