Fil d'ariane

Icône

Se retrouver dans le dédale du savoir et de l'information – Pour une gestion structurée de l'information

Les promesses de la gestion des archives audiovisuelles

Alors qu’il y a deux mois j’ignorais encore tout, ou presque, du monde audiovisuel, je me vois maintenant plongée dans un monde de progrès et réflexions prometteurs.

Je commencerai par mes impressions, toutes personnelles, et peut-être encore candides. Avec l’ère du numérique, je vois les documents audiovisuels passer du statut de documents à part, au statut de documents comme les autres. Non seulement les documents audiovisuels rentrent dans la famille de l’information à titre de document «comme un autre», mais ils y rentrent à titre d’objet de recherche inter et multidisciplinaire. Ceci est un atout. Il me semble à la lecture des écrits que j’ai lus jusque là, que les problématiques liées aux archives audiovisuelles vont permettre en retour d’alimenter les recherches en information textuelles dans un contexte numérique. C’est encore flou dans ma tête, mais c’est une intuition. Actuellement, les questions sur la gestion des archives audiovisuelles sont nourries par et adaptées des techniques traditionnelles de la bibliothéconomie mais aussi de l’archivistique et de l’informatique, et ce, tant au niveau conceptuel que technique.

Mais pour revenir sur des bases plus solides, je vous propose une synthèse de quelques lectures que j’ai faites dernièrement dans le cadre du projet de recherche sur réseau e-inclusion.

Qu’est-ce que des archives audiovisuelles ?

Les archives audiovisuelles, c’est un ensemble de documents et produits, publiés ou non, inscrits sur divers supports, de divers formats, tant au niveau analogique que numérique, qui ont évolué durant le temps et sont plus ou moins stables. Parmi les particularités de ces documents, on trouve :

  • Leur temporalité : à savoir qu’ils ne sont accessibles ou presque que selon leur rythme intrinsèque, on ne s’y repère pas par page mais en fonction d’un pointeur de temps. (voir Bachimont, 1998, à ce sujet).
  • Il s’agit d’une suite d’images fixes couplées avec du son, d’où le terme audio-visuel.

Comme le disent Olwen Terris — «[f]ilm and television archives are […] rich repositories of individual images» (Terris 1998, 54) — et Jorge Caldera-Serrano — «the moving image does not actually exist in television or film, but it is an optical effect called “retinal persistence” […], these images are actually still images. » (Caldero 2008, 18 ) — , ce qui permet d’espérer arriver à une reconnaissance des images ayant un haut niveau de complexité plus rapidement. L’impact sera de potentiellement obtenir de meilleurs outils pour l’indexation automatique au niveau descriptif du contenu.

Les images en mouvement font partie des documents qui permettent de témoigner de l’existence de certains faits et gestes. Mais il s’agit également d’un témoignage de l’interaction avec la société et ses influences (tant au niveau mental que sociétal) (Andreano 2007, 83).

D’ailleurs, l’UNESCO, en 1980, a officiellement reconnu que les films constituaient des documents qui avaient une valeur historique et qu’ils témoignaient d’une expression culturelle des peuples (Andreano 2007, 83) . Le jour officiel dédié à l’héritage audiovisuel a été lancé le 27 octobre 2007.

Pour le moment, il semblerait que les archives audiovisuelles sont une source de documentation sous-exploitée. Parmi les freins que l’on peut identifier à l’utilisation des images en mouvement en tant que source, on compte :

  • Le manque de crédibilité auprès de la communauté des historiens, notamment, mais ce serait en train de changer.
  • L’accessibilité difficile. Dans le monde des documents analogiques, les difficultés d’accès étaient indéniables (cela demande de posséder les matériel adéquat, par exemple) et donner accès à des images en mouvement reste souvent un exercice qui demande beaucoup de travail et de ressources matérielles, et donc d’argent. Le numérique est en passe de changer ça.
    Également point de vue accessibilité : il est impossible ou presque pour le moment de fureter et de naviguer librement à travers le contenu des films ou tout simplement des collections de films. Il y a très peu de description de contenu pour des raisons comme le temps et l’argent, encore une fois. Ce temps qui n’est pas investi dans la description retombe sur les épaules des chercheurs, ce qui freine eencore leur intérêt pour ce type de document (Andreano 2007, 84) .
    Ensuite, comme l’a écrit Bruno Bachimont dans plusieurs de ses écrits (1998, 2007), les images en mouvements sont des documents temporels linéaires qui forcent un rythme de lecture contrairement à un livre. Mais encore une fois, le numérique ouvre à de nouvelles possibilités (Bachimont 2007, Andreano 2007, Caldera-Serrano 2008).
    Et il existe encore d’autres freins qui ne me viennent pas à l’esprit maintenant, qui font obstacle l’accès à ces sources d’information.

Une des solutions pour les questions d’accessibilité sont l’indexation et la description. Sans être le seul à l’affirmer (je ne pourrais lister tout le monde), Andreano (2007) insiste sur le fait que la description est un lien essentiel pour l’accès, c’est d’ailleurs vrai pour tout type de document.

Décrire quoi et comment

Il faut une description et une indexation, mais à quel niveau ?
La première distinction se fait entre la manifestation du document dans son entièreté et sa globalité, et de son contenu. Actuellement, dans les catalogues, les films sont représentés par une description de type bibliographique associée à des sujets concernant l’ensemble de la production, et non d’une description détaillée plan par plan, ni par chapitre, comme on peut le trouver dans les DVD. Pour en apprendre plus sur le catalogage des images en mouvement, il est bon de se référer à Martha Yee (2007).

Cependant, tout comme il est possible maintenant de faire des recherches en plein texte dans les documents textuels, l’accessibilité aux documents audiovisuels plan par plan, dont le concept n’est pas nouveau et faisait partie de la mission et des objectifs d’origine de la National Film and Television Archive (NFTVA) à Londres en 1935, devrait pouvoir être davantage envisageable.

Les avantages de la description plan par plan sont les suivants (Terris 1998,54-55):

  • Cela évite au chercheur d’avoir à visionner le film en entier si à partir de la description on sait que ce type de séquence n’est pas dans ce film.
  • Les chercheurs sont plus intéressés à ce qu’ils entendent plutôt qu’à ce qu’ils verraient. Et Caldero (2008 ) de rajouter «[…] particulary for television material, most of the time sound can provide a higher informative content than audio-visual information.» (Caldero 2008, 17)
  • Cela ajoute de l’information utile pour documenter la production d’un film.
  • Cela augmente le nombre de points d’accès.
  • Terris indique que le «[s]hotlisting is largely a service provided by cataloguers for users who don’t know exactly what they want. (Terris, 1998 )»

    Quant à la profondeur ou le détail de la description, tout dépend des besoins des utilisateurs, donc de la collection et du fonds. De plus, «[g]iving a fuller description of content and providing in-depth indexing will “sell’ the film to a wider audience.» (Terris 1998, 57). Donc, cela augmente la valeur commerciale de la collection. Andreano souligne quant à lui qu’une image individuelle dans un film peut avoir plus de valeur que le film au complet (Andreano 2007, 85).
    Les deux auteurs signalent qu’un des désavantages majeur de la description plan par plan, c’est le temps, le manque de catalogueurs qualifiés et bien sûr l’argent (Terris 1998, Andreano 2007).

    Plusieurs moyens sont maintenant disponibles pour rendre l’indexation plus efficace et donc l’extraction d’information plus facile et rapide pour l’utilisateur (Andreano 2007, 85) :

  • l’automatisation à l’aide des nouvelles technologies, ce qui permet d’augmenter la productivité;
  • la folksonomie (participation des utilisateurs) et les descriptions en vocabulaire libre;
  • le vocabulaire contrôlé pour aider soutenir et guider indexeur et par conséquent, l’usager dans ses recherches;
  • la conjonction de la recherche plein texte, de l’indexation en vocabulaire libre par les catalogueurs professionnels comme le public, du vocabulaire contrôlé et des technologies en intelligence artificielle (reconnaissance vocale et d’images), elles-mêmes nourries et améliorées par le vocabulaire utilisé et produit dans une relation rétroactive différée.

Les promesses du numérique concernant l’indexation, les descriptions et l’extraction d’information

Les possibilités offertes par les progrès technologiques en extraction automatique d’information et en intelligence artificielle ne manqueront pas d’aider les gestionnaires de l’information à mieux répondre aux besoins des utilisateurs. La technologie ne remplacera pas l’intervention humaine nécessaire pour indexer ou décrire des choses et relations que les machines ne peuvent détecter correctement, notamment tout ce qui est conceptuel et symbolique. S’assurer de bien comprendre et de répondre adéquatement aux besoins des utilisateurs, seuls les humains peuvent le faire, car nous avons la capacité cognitive de faire des liens, particulièrement concernant les questions futures non prédictibles. Comme le dit Terris, fort de son expérience, «[…] human indexing intervention would be needed to make retrieval possible under the unspoken, sought after, terms.» (Terris 2001, 42)

À court-moyen terme, l’extraction automatique de contenu, la reconnaissance vocale, les recherches en biométrie et en reconnaissance d’image, sont autant de technologies qui iront et pourront supporter le travail des gestionnaires de l’information, en augmentant la productivité et l’efficacité au niveau descriptif du contenu. Le niveau contextuel, conceptuel et parfois plus subjectif dont certains utilisateurs ont besoin, demandera nécessairement une intervention humaine et plus souple, que ce soit pour faire évoluer les relations sémantiques en fonction de l’évolution de la société et des connaissances (une pré-coordonination, la création de thésaurus, d’ontologies, etc.) ou en fonction d’une demande toute nouvelle, qui vient d’émerger, donc dans le soutien à l’utilisateur «avec les moyens du bord» et l’aide de méthodes d’heuristiques acquises de par le savoir-faire et développées en fonction de sa propre expérience et en interaction directe avec l’utilisateur (davantage en post-coordination) .

Bibliographie

Andreano, K. 2007. The Missing Link : Content indexing, User Created Metadata, and Improving Scholarly Access to Moving Image Archives. The Moving Image 7-2 (Fall), p. 82-99

Ce texte est un bon article pour avoir un point de vue d’ensemble de la question des archives audiovisuelles concernant l’indexation et sur les avantages et inconvénients de chaque pratique : indexation automatique, indexation par les utilisateurs (folksonomie), indexation ou description en vocabulaire libre ou contrôlé, etc.

Caldera-Serrano, J. 2008. Changes in the management of information in audio-visual archives following digitization : Current and future outlook. Journal of Librarianship and Information Science 40-1 (March), p.13-20

Bachimont, B. 1998. Bibliothèques numériques audiovisuelles : des enjeux scientifiques et techniques. Document numérique 2, no 3-4.

Bachimont, B. 2007. Ingénierie des connaissances et des contenus : le numérique entre ontologies et documents. Paris: Hermès science publications.

Terris, O. 1998.There was this film about… The Case for the Shotlist. Journal of film preservation 56, p.54-57

Terris, O. 2001.What you Don’t See and Don’t Hear : Subject Indexing Moving Images. Journal of film preservation 62, p.40-43

Yee, M. M. 2007. Moving image cataloging : how to create and how to use a moving image catalog. Westport, Conn.: Libraries Unlimited. xiv, 273

Classé dans:Ère du numérique, Catalogage, Documents audiovisuels, Documents numériques, Folksonomie, Métadonnées, Web 2.0,

Calames : Catalogue en ligne des archives et manuscrits (France)

Calames est un nouveau catalogue proposé par l’ABES, dédié aux fonds d’archives et de manuscrits conservés dans les bibliothèques d’Enseignement Supérieur et de Recherche.

Sur le site de l’ABES (Agence bibliographique de l’enseigement supérieur), on peut lire à propos de ce catalogue que ce projet est issu de la «rétroconversion du Catalogue Général des Manuscrits des Bibliothèques Publiques de France (CGM), que la BnF pilote pour le compte du Ministère de la Culture et du Ministère de l’Enseignement Supérieur et de la Recherche. Le projet de rétroconversion doit s’achever en janvier 2008, avec la livraison des fichiers XML conformes au format EAD» démarrée en 2002.

«Les 70000 pages du catalogue ont été numérisées et encodées en EAD. Les bibliothèques de l’Enseignement Supérieur ont travaillé sur 20% de cet ensemble, soit 36000 notices… »

Fait intéressant : «Dès le premier trimestre 2008, les catalogueurs de manuscrits pourront mettre à jour leurs fichiers.

Si, à l’ouverture, les 36 000 notices Enseignement Supérieur du CGM formeront l’essentiel de ce nouveau catalogue, son périmètre sera plus large. Il permettra à toutes les bibliothèques de cataloguer et de valoriser des fonds encore sous-exploités faute de moyens, de formation ou d’outils. (… ) le catalogueur EAD pourra bénéficier de toute la richesse des autorités Sudoc pour normaliser les entrées d’index»

Selon l’ABES, «l’objectif est de proposer un outil de recherche et de consultation qui exploite autant que possible la richesse et la structuration des données EAD, sans que l’utilisateur se sente perdu. Le catalogue sera ouvert sur l’extérieur, à savoir les portails des établissements, le portail Sudoc, le CCFr et le Web en général

Aussi, «la BDIC et la Bibliothèque Littéraire Jacques Doucet s’ajouteront à cette liste d’établissements lors du premier déploiement de Calames.»

Pour en savoir plus sur le projet, consultez leur site. Un beau projet de collaboration semble-t-il.

Documents connexes rendus disponibles par l’ABES:

  • Atelier Calames – 30 mai 2007 (pdf)
  • Arabesque 48 – nov-déc. 2007 (pdf)

Classé dans:Archivistique, Bibliothèques, Catalogage, Normes descriptives

Création d’un « Fichier d’Autorité International Virtuel » (VIAF).

La Bibliothèque nationale de France, la Bibliothèque du Congrès (USA) et la Bibliothèque nationale d’Allemagne, en collaboration avec OCLC, ont signés un accord afin de mettre en commun leurs fichiers d’autorité respectifs pour créer, un « Fichier d’Autorité International Virtuel » (VIAF).

Ce fichier constituera un guichet unique, sur le Web, libre d’accès et gratuit, pour les notices de référence sur les personnes, les collectivités, les lieux (notices dites « d’autorité »). D’autres partenaires seront appelés à rejoindre ce programme international.
Comme la Bibliothèque du Congrès et la Bibliothèque nationale d’Allemagne l’ont déjà fait, la BnF s’engage à fournir toutes les notices d’autorité de son catalogue BN-OPALE PLUS et à mettre à disposition les ressources humaines nécessaires à la bonne exécution du projet.

Cet accord est une reconnaissance internationale de la qualité du travail de tous les catalogueurs de la BnF. Il constitue une avancée de la francophonie dans le web sémantique. Ce fichier virtuel sera multilingue et pourra être utilisé par les moteurs de recherche du web comme un référentiel.

Fondé en 1967, OCLC (Online Computer Library Center) est un organisme de recherche à but non lucratif qui offre des services aux bibliothèques afin qu’elles puissent accroître leur accès à l’information mondiale tout en réduisant leurs coûts.

Source : communiqué de presse BNF du 4 octobre 2007

Classé dans:Catalogage, Métadonnées, Moteurs de recherche, Web sémantique

Karin Michel, M.S.I.
Architecte d’information et de données, Gouvernance de l’information et des données

M.S.I obtenue à l'École de bibliothéconomie et des sciences de l'information
Université de Montréal
Québec - Canada

Les propos tenus sur ce blogue sont des réflexions personnelles et n'engagent en rien mon employeur ou quelque personne que ce soit avec laquelle je travaille.

Intérêt en
gouvernance des données, architecture d'entreprise, modélisation de données, knowledge management, RIM, GID / GED, architecture de l'information et de données, ..., analyses de besoins, etc.
Logo AIIM SharePoint Practioner

Pages