Archives et IA

Il y a des milliards de photos et de pictogrammes. Chaque film sur pellicule est une série de 24 ou 25 images par seconde sur un négatif argentique. La quantité de documents photographiques existants aujourd’hui dans la mémoire numérique mondiale est faramineuse. Que ce soit en JPEG, en TIFF, en DPX ou en raw. Un des problèmes auxquels nous sommes tous confrontés est le classement. Comment retrouver la photo ou l’image que nous cherchons. C’est un problème crucial pour les gestionnaires de fonds d’archives.

L’intelligence artificielle va nous donner un coup de main. Comme votre Facebook reconnaît certains de nos amis sur les photos que vous postez, l’IA peut identifier n’importe qui sur à peu près n’importe quelle image.

Plutôt que d’identifier un milliard de chinois avec des caméras de surveillance, nous allons développer des programmes qui reconnaîtront les visages qui se répètent souvent dans une bobine, dans un dossier, dans les archives d’une année, dans un fonds d’archives entier. Le programme demandera à l’éditeur: “Qui est cette personne? J’ai constaté la présence de ce visage dans 4.500 des images de cette bobine de 15 minutes.” L’éditorialiste répondra qu’il s’agit de Marcello Mastroianni, et en profitera pour indiquer à l’IA que la magnifique jeune femme à ses côtés est Sofia Loren.

Quelques minutes plus tard, l’IA annoncera que dans la même bobine il y a 2.700 photogrammes sur lesquels Sofia Loren est visible.

Deux heures plus tard, l’IA annoncera qu’il y a encore 5.000 images avec Mastroianni et Loren sur toute la matière numérisée le même jour.

Une semaine plus tard, c’est 41 minutes d’images de Sofia Loren à différentes époques que l’IA aura retrouvées, dans la totalité d’un fonds d’archives. Le développement de ce genre d’outil n’est pas simple, mais très certainement pas impossible. Les briques existent, il suffit de les assembler et de donner au programme les bonnes informations pour ses recherches. L’IA n’est pas vraiment intelligente. Elle est juste très, très rapide. Et elle applique les algorithmes qui lui ont été destinés. Nous pouvons la maîtriser, ce n’est pas réservé à la Silicon Valley.

Les possibilités de la reconnaissance faciale sont immenses et encore peu envisagées. Un programme adapté tournant sur un serveur puissant et ayant accès à une grande quantité d’images renseignera les occurrences les plus nombreuses. Tel chef d’état, tel premier ministre, tel champion sportif ou vedette du cinéma. Même si ils n’ont jamais été détectés par les éditorialistes. Et peut-être retrouvera-t-on dans un fonds d’archives d’un pays méditerranéen des images de Sofia Loren entretenant une liaison secrète avec Jean Gabin sur les plages de la Méditerranée.

L’IA ne fait pas que reconnaître les visages. Elle est capable de reconnaître les bâtiments, les paysages et les villes dont on lui aura fourni les références. L’indexation automatique assistée par IA présente des possibilités encore insoupçonnées. Elle ne remplacera pas l’intelligence des éditorialistes, elle la complétera et les rendra beaucoup plus puissants, plus rapides et plus efficaces.

Archives film vs archives vidéo

archives Reyers

Le support film est un support difficile à manipuler, dans l’obscurité totale tant qu’il n’a pas été chimiquement développé. Il est onéreux, il s’agit de grains d’argent photosensibles appliqués sur un support d’acétate de cellulose.

L’image n’est pas visible immédiatement, il faut d’abord faire réagir la pellicule avec différent produits chimiques (révélateur, fixateur, blanchiment) pour obtenir un négatif stabilisé qui n’est plus photosensible et qui peut-être tiré sur une pellicule positive pour être projeté.

Ce processus est long, aléatoire (les concentrations et stabilités des bains de développement influencent beaucoup le résultat), onéreux, artisanal et difficile (il faut charger et décharger les caméras dans l’obscurité absolue).

La conséquence de tout cela est évidemment qu’on tourne avec de parcimonie. Si le sujet en vaut la peine, et uniquement lorsqu’on est sûr de soi.

L’arrivée de la vidéo, qui permet une vision immédiate, dont le support est effaçable et réutilisable et qui est fiable dans ses résultats, va changer complètement la donne. On va tourner beaucoup plus et le rapport entre le nombre d’heures d’archives qui seront conservées et leur intérêt intrinsèque va fortement diminuer. Les archives film sont beaucoup plus précieuses, beaucoup plus fragiles et beaucoup plus fréquemment intéressantes.

Mais la pellicule est vieille, souvent abîmée, atteinte par diverses dégradations chimiques, parfois cassante. Il est fréquent qu’une pellicule ne puisse passer qu’une fois sur le scanner sans casser. Un deuxième passage sera trop exigeant en sollicitations mécaniques et verra la pellicule se tordre ou casser fréquemment.

Il faut donc aborder la numérisation des archives films de façon philosophiquement totalement différente des archives vidéo. Il n’y a pas droit à l’erreur. A priori, on ne peut pas recommencer. Il faut viser immédiatement le plus haut niveau de qualité, c’est tout un héritage culturel qui est en jeu. On ne peut pas imaginer de numériser en qualité moyenne et de repasser une deuxième fois ce qui semblera intéressant, le risque étant trop grand. Il s’agit avant tout ici d’un processus artisanal, culturel, historique et patrimonial bien plus que d’une activité industrielle et commerciale. Il n’y a qu’en ne perdant pas ça de vue qu’on peut aborder judicieusement la numérisation des archives film.

Le Syndrome du Vinaigre

Sous ce titre un peu inquiétant se cache un phénomène très courant dans le traitement des archives sur pellicule film, et des films « âgés » de façon plus générale. Ce n’est pas la seule dégradation que la pellicule puisse subir avec le temps, mais dans le cas des films « modernes », c’est certainement la plus fréquente. Par films modernes, j’entends les films dont le support est le tri acétate de cellulose qui a remplacé à partir de la fin des années quarante les films en nitrate de cellulose qui étaient spontanément inflammables à partir d’une certaine température, et donc dangereux à manipuler.

Le tri acétate de cellulose, appelé plus couramment acétate de cellulose, est le support des couches d’émulsion argentique photosensible. Il est fabriqué par un traitement chimique avec de la cellulose et de l’acide acétique.

Malheureusement, sa stabilité à long terme est relative. Si la pellicule n’est pas conservée dans des conditions de température et d’humidité optimales et très stables, le risque d’apparition du syndrome du vinaigre existe. Et soyons honnêtes, des archives qui ont 50 ans ou plus n’ont à peu près jamais été conservées dans des conditions optimales. Il semble en outre que certaines bactéries et levures présentes dans l’air accélèrent le processus, ainsi que la rouille des boitiers métalliques.

Mais en quoi consiste ce syndrome du vinaigre ? Le tri acétate de cellulose se désolidarise, et la cellulose revient à son état originel, de même que l’acide acétique qui n’est autre que du vinaigre. Lequel lentement s’évapore et diffuse une forte odeur. Les bobines de pellicule atteintes sentent fort, ou même très fort le vinaigre.

Cette dégradation atteint le support de façon aléatoire et en surface. Un film atteint par le syndrome du vinaigre présente plusieurs symptômes, outre l’odeur dont nous avons parlé.

  • Comme un de ses composants (l’acide acétique) s’est, en partie, évaporé, le film a rétréci. Cette réduction de taille, appelée le retrait, peut aller jusqu’à 5%. Le film est donc 5% plus court que ce qu’il était à l’origine. Et l’espace entre les perforations a donc rétréci d’autant.
  • Le film n’est pas atteint de façon égale sur toute sa surface, mais bien à certains endroits et de façon aléatoire. On a donc une surface à l’origine plane qui subit localement un rétrécissement. Il en découle une ondulation dans les deux axes, tant dans le sens de la longueur de la pellicule que de la largeur.
  • Dans les cas les plus extrêmes, la pellicule perd de la transparence. La cellulose désolidarisée du vinaigre ne conservant pas ses propriétés de transparence.

Si on veut numériser dans un but de pérennisation de la pellicule atteinte par ce syndrome, et c’est notre cas tous les jours à la Sonuma, il faut mettre en œuvre des procédures particulières.

Comme le film a rétréci, il n’est plus possible d’utiliser des cabestans avec ergots pour l’entrainement ou la régulation de la vitesse. En effet, l’utilisation de cabestan avec ergots tel qu’illustré ici aurait pour effet immédiat de déchirer notre pellicule car suite au retrait, les perforations sont moins espacées.

Pour palier à ce problème potentiel, on utilise des machines équipées uniquement de cabestans lisses. En caoutchouc pour l’entrainement ou le nettoyage et en métal pour le guidage. Le comptage des perforations est effectué par une caméra située à coté du scanner et qui régule le moteur d’entrainement pour maintenir un défilement constant du nombre d’images par seconde.

Le problème qui se pose encore est de s’assurer que la pellicule sera bien plane au moment de sa numérisation. En effet, le capteur numérique travaille avec une profondeur de champs très faible, et une ondulation de l’image peut rendre une partie de celle-ci floue. On utilise à cette fin un galet presseur monté sur le gate. L’image est écrasée juste au moment où elle passe sous le scanner.

On voit ici le galet presseur ouvert sur le gate. La source de lumière vient d’en bas, le film défile sur le gate et il est aplati par le galet qui est alors fermé. Le capteur est en haut. De cette façon, on obtient un maximum de netteté sur l’ensemble de la surface de l’image sans lui imposer de trop grands efforts mécaniques.

Les problèmes de l’image se posent également pour le son. Les archives des télévisions sont en général en sepmag, ce qui signifie que le son est sur de la pellicule 16mm magnétique séparée. Dont le support est également de l’acétate de cellulose. Le problème est donc semblable. Dans ce cas-ci, c’est un laser qui compte les perforations et qui corrige sans arrêt la vitesse de défilement pour la maintenir la plus proche possible de la vitesse nominale (dans ce cas-ci 25 images par seconde). Et de nouveau, tous les cabestans sont lisses pour ne pas risquer de de déchirer la pellicule.